在2024年即将结束之际,各大社交平台纷纷推出年度报告。而在人工智能(AI)领域,这场竞争的另一场角逐也在进行中,最新的AI大模型评测成果近日公布,引发了行业内的广泛关注。根据智源研究院于12月19日发布的FlagEval“百模”评测结果,国产AI大 ...
一加 Ace 5 Pro 在系统优化上,也带来了「潮汐引擎」、「极光引擎」、「内存基因重组 3.0」等多项自研技术,并且首发芯片级游戏技术「风驰游戏内核」,在上一代原生级 120 帧游戏体验的基础上,继续升级为行业独家原生级 120 帧 + ...
得益于多模态能力的提升,AI模型最新K12学科测验综合得分相较于半年前提升了12.86%,但是仍与北京海淀学生平均水平存在差距。不过,AI模型普遍存在“文强理弱”的偏科情况,在英语和历史文科试题的表现上,已有AI模型超越了人类考生的平均分。
机器之心发布机器之心编辑部在当今迅速发展的人工智能时代,大语言模型(LLMs)在各种应用中发挥着至关重要的作用。然而,随着其应用的广泛化,模型的安全性问题也引起了广泛关注。探讨如何评估和提升这些模型在复杂的法律、政策和伦理领域的安全性,成为了学术界和 ...
在即将过去的2024年,一加为我们带来了压轴的旗舰级电竞体验的Ace5 Pro,其实今年的一加Ace3 Pro凭借原生120帧原神、6100mAh双芯冰川电池等特性一路圈粉。作为今年压轴登场的一加Ace5 ...
智东西 作者 | 徐豫 编辑 | 漠影 还有不到一周就2025年了,各大社交音娱平台相继自动弹出“年度报告”的搜索选项。身处AI元年,AI模型这份年终答卷,自然也少不了。
智源研究院的大模型评测平台FlagEval自2023年6月上线以来,已覆盖全球800余个开闭源模型,超过200万条评测题目,成为全球大模型评测的重要平台。此次评测,FlagEval在评测方法与工具上联合了全国10余家高校和机构合作共建,不仅扩展、丰富 ...
一、前言:荣耀GT独立 首次降低性能手机入手门槛 2024年末,荣耀正式将GT系列独立,定位于游戏体验和高性价比市场。 但其实荣耀GT并非荣耀首款主打游戏概念的手机,早在6年前,荣耀Play便首发了GPU Turbo技术,提升游戏性能,该系列不断更新 ...
智源研究院百模评测结果。2024年12月19日,智源研究院举办了一场秋冬评测发布会,其中一场大模型辩论赛引人注目。参与辩论的大模型能够引用经典文献,并根据对手的论点进行反击。尽管这些大模型的表现与真人辩手仍有差距,但这场辩论展示了大模型的能力。