评测 - 搜索 News

1 天

在2024年即将结束之际，各大社交平台纷纷推出年度报告。而在人工智能（AI）领域，这场竞争的另一场角逐也在进行中，最新的AI大模型评测成果近日公布，引发了行业内的广泛关注。根据智源研究院于12月19日发布的FlagEval“百模”评测结果，国产AI大 ...

11 小时

一加 Ace 5 Pro 在系统优化上，也带来了「潮汐引擎」、「极光引擎」、「内存基因重组 3.0」等多项自研技术，并且首发芯片级游戏技术「风驰游戏内核」，在上一代原生级 120 帧游戏体验的基础上，继续升级为行业独家原生级 120 帧 + ...

得益于多模态能力的提升，AI模型最新K12学科测验综合得分相较于半年前提升了12.86%，但是仍与北京海淀学生平均水平存在差距。不过，AI模型普遍存在“文强理弱”的偏科情况，在英语和历史文科试题的表现上，已有AI模型超越了人类考生的平均分。

机器之心发布机器之心编辑部在当今迅速发展的人工智能时代，大语言模型（LLMs）在各种应用中发挥着至关重要的作用。然而，随着其应用的广泛化，模型的安全性问题也引起了广泛关注。探讨如何评估和提升这些模型在复杂的法律、政策和伦理领域的安全性，成为了学术界和 ...

10 小时

在即将过去的2024年，一加为我们带来了压轴的旗舰级电竞体验的Ace5 Pro，其实今年的一加Ace3 Pro凭借原生120帧原神、6100mAh双芯冰川电池等特性一路圈粉。作为今年压轴登场的一加Ace5 ...

来自MSN1 天

智东西作者 | 徐豫编辑 | 漠影还有不到一周就2025年了，各大社交音娱平台相继自动弹出“年度报告”的搜索选项。身处AI元年，AI模型这份年终答卷，自然也少不了。

2 天

智源研究院的大模型评测平台FlagEval自2023年6月上线以来，已覆盖全球800余个开闭源模型，超过200万条评测题目，成为全球大模型评测的重要平台。此次评测，FlagEval在评测方法与工具上联合了全国10余家高校和机构合作共建，不仅扩展、丰富 ...

12 小时on MSN

一、前言：荣耀GT独立首次降低性能手机入手门槛 2024年末，荣耀正式将GT系列独立，定位于游戏体验和高性价比市场。但其实荣耀GT并非荣耀首款主打游戏概念的手机，早在6年前，荣耀Play便首发了GPU Turbo技术，提升游戏性能，该系列不断更新 ...

智源研究院百模评测结果。2024年12月19日，智源研究院举办了一场秋冬评测发布会，其中一场大模型辩论赛引人注目。参与辩论的大模型能够引用经典文献，并根据对手的论点进行反击。尽管这些大模型的表现与真人辩手仍有差距，但这场辩论展示了大模型的能力。

一些您可能无法访问的结果已被隐去。