搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
房地产
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
过去 30 天
时间不限
过去 1 小时
过去 24 小时
过去 7 天
按相关度排序
按时间排序
7 小时
on MSN
Hugging Face / 英伟达联手推出 ModernBERT 模型
12 月 29 日消息,Hugging Face、英伟达和约翰霍普金斯大学研究人员联手为 Hugging Face 上的热门编码器模型 BERT 推出了全新版本 ModernBERT,号称在满足效率的同时新增支持处理长达 8192 个 Token ...
6 小时
Hugging Face 研究“AI 降本增效”:给予更长运算时间让低成本小模型 ...
此外,谷歌 DeepMind 最近也公布了类似的论文,他们认为可以为小模型动态分配运算资源,并设置验证器对模型的解答结果进行评分,从而引导模型不断输出正确的答案,从而帮助企业以较少的资源部署足够精度的语言模型。
6 小时
on MSN
Hugging Face与英伟达等推出ModernBERT,能否超越BERT成新宠?
近期,Hugging Face携手英伟达及约翰霍普金斯大学的研究人员,共同推出了BERT模型的全新升级版本——ModernBERT。这一新版本不仅在效率上有所提升,更突破了原有模型在处理长文本上的限制,能够支持高达8192个Token的上下文处理。
来自MSN
3 天
小模型可用更长运算时间换取更高精准度,Hugging Face发布测试阶段 ...
由于目前大型语言模型的性能,主要依赖大量的训练计算资源,而正是这种昂贵的成本模式,驱使开发公司寻求替代方案。而Hugging Face的研究显示,通过测试阶段运算扩展(Test-Time Compute ...
1 小时
美国四大厂出手核电:亚马逊将投5亿美元,Meta已发核电征集令
2024 年,在美国五大科技巨头中,微软、谷歌、亚马逊、Meta 这四家公司在核电布局领域动作频频。甚至你争我赶生怕落后对方一步:9 月微软宣布入场;10 月谷歌宣布入场,两天后亚马逊也宣布新动态;虽迟但到的 Meta 也于 12 月宣布入场。可以说 ...
腾讯网
2 小时
美国四大厂出手核电:微软重启三里岛,谷歌牵手核新秀,亚马逊将 ...
“人工智能有一个肮脏的秘密...... 生成式人工智能是惊人的能源密集型(领域),甚至比普通的云服务更为密集……谷歌、Meta 和微软都在尽最大努力购买绿色能源和碳信用额。(但)事实是,这还不够。”2024 年 3 ...
24 天
英伟达提出全新Star Attention,10倍加速LLM推理!登顶Hugging Face论文榜
【新智元导读】 大模型如今已具有越来越长的上下文,而与之相伴的是推理成本的上升。英伟达最新提出的Star Attention,能够在不损失精度的同时,显著减少推理计算量,从而助力边缘计算。 为此,已有多种优化方案提出,例如Flash ...
来自MSN
23 天
Hugging Face发布SmolVLM开源 AI 模型:20 亿参数,用于端侧推理
IT之家 11 月 27 日消息,Hugging Face 平台昨日(11 月 26 日)发布博文,宣布推出 SmolVLM AI 视觉语言模型(VLM),仅有 20 亿参数,用于设备端推理 ...
2 天
马斯克说中国聪明人很多,谷歌前CEO说限制他们居然还能追上美国
CNBC说中国希望在AI领域占据主导,部分模型已经击败美国竞争对手。这话听着挺提气,但我觉得还是要保持清醒。毕竟,AI不是简单的技术竞赛,更像是一场马拉松。美国的技术积累确实深厚,我们追赶的路还很长。不过话说回来,"后发优势"这个词挺有意思。当你看到 ...
来自MSN
5 小时
阿里巴巴发布大模型报告,坚持云和AI协同发展
在日前举行的大模型技术发展与治理创新研讨会上,阿里巴巴集团与中国电子技术标准化研究院联合发布《大模型技术发展及治理实践报告》(以下简称为《报告》)。值得一提的是,这也是阿里巴巴连续第三年发布AI治理相关报告。
凤凰网
2 天
deepseekv3模型意外泄露,跑分超越claude3.5sonnet
据悉,该模型目前在Aider多语言编程测试排行榜中的成绩已经超过了 Anthropic 的Claude 3.5 Sonnet,排名第二,仅次于 OpenAI 的O1 模型。据悉,DeepSeek V3 模型采用MOE ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈