当地时间12月26日,H2O.ai 宣布其 h2oGPTe Agent 以前所未有的 65% 的得分在 GAIA(通用 AI 助手)基准排行榜上名列前茅,超过了 Google Langfun Agent 的 49%、Microsoft ...
据悉,该模型目前在Aider多语言编程测试排行榜中的成绩已经超过了 Anthropic 的Claude 3.5 Sonnet,排名第二,仅次于 OpenAI 的O1 模型。据悉,DeepSeek V3 模型采用MOE ...
由于目前大型语言模型的性能,主要依赖大量的训练计算资源,而正是这种昂贵的成本模式,驱使开发公司寻求替代方案。而Hugging Face的研究显示,通过测试阶段运算扩展(Test-Time Compute ...
自动驾驶卡车公司 TuSimple 宣布完成转型,正式更名为 CreateAI,并将业务重心转向生成式人工智能领域,涵盖动画和游戏开发。这次品牌重塑标志着 TuSimple 放弃了自动驾驶卡车业务,迈入全新赛道。
阿布扎比技术创新研究院(TII)发布新一代开源AI模型Falcon3,凭借14万亿token的训练量和优化的架构设计,在消费级硬件上的性能表现创下新纪录。这一训练规模是其前代产品Falcon2的两倍有余。
2024年12月19日-图森未来(TuSimple)今日正式启用全新品牌CreateAI,并发布多项在生成式AI领域的重大进展。CreateAI宣布获著名武侠IP《金庸群侠传》正版授权,将开发一款大型武侠开放世界RPG游戏。CreateAI还将与著名 ...
CNBC报道称,中国想在AI领域成为统治者,这种尝试可能已经获得回报。一些美国AI业内人士和科技分析人士认为,中国AI模型已经相当流行,从性能角度看,中国的一些模型与美国产品齐头并进,甚至超越。
(上海、纽约17日讯)中国称霸人工智能(AI)领域的努力可能逐渐奏效。业界和分析师向《CNBC》表示,中国的AI模型广受欢迎,就效能而言正直追甚至超越美国对手。AI已成为美中之间最新战场,双方均将此视为有战略意义的技术。华府持续管制中国取得最先进的A ...
IT之家12 月 14 日消息,距离 POINT1.0 的发布已经过去两个月的时间,腾讯今天宣布推出 POINTS1.5。 IT之家注意到,POINTS1.5 仍然沿用了 POINTS1.0 中使用的经典的 LLaVA 架构,由一个 vision encoder,一个 projector 和一个大语言模型组成。 据官方介绍,这一代 POINTS 模型,不 ...
值得一提的是,这篇文章受到了广泛的关注,登顶 Hugging Face 每日论文榜首。 2)token 生成,即模型关注 KV 缓存并自回归生成新令牌,同时用新的 KV ...
值得一提的是,这篇文章受到了广泛的关注,登顶 Hugging Face 每日论文榜首。 2)token 生成,即模型关注 KV 缓存并自回归生成新令牌,同时用新的 KV 向量更新缓存。 在许多长上下文任务中,输入由一个长上下文后跟一个短查询和一个短答案组成。当大模型的 ...