Latent - 搜索 News

12 小时

百科知识：DeepSeek-V3 在知识类任务（MMLU, MMLU-Pro, GPQA, SimpleQA）上的水平相比前代 DeepSeek-V2.5 显著提升，接近当前表现最好的模型 Claude-3.5-Sonnet-1022。

13 小时

过去多年间，科学家们持续致力于探索蛋白质的结构和组成，以更好的解谜「生命密码」。蛋白质功能由其结构决定，包括侧链和主链原子的身份、位置及其生物物理性质，这些统称为全原子结构。

1 天

据悉，小米大模型团队成立之初便已拥有6500张GPU资源，显示出小米在AI领域的决心和实力。尽管小米方面尚未对此消息发表评论，但知情人士透露，该计划已实施数月，雷军在其中扮演了关键领导角色，强调小米在AI硬件领域的重视。

十轮网科技资讯 on MSN3 天

Meta新推出的BLT（Byte Latent ...

1 天

12月26日，界面新闻独家获悉，小米正在着手搭建自己的GPU万卡集群，将对AI大模型大力投入。小米大模型团队在成立时已有6500张GPU资源。

1 天

12月26日，界面新闻独家获悉，小米正在着手搭建自己的GPU万卡集群，将对AI大模型大力投入。小米大模型团队在成立时已有6500张GPU资源。

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：liyazhou@ ...

总的来说，团队提出的新颖框架4K4DGen允许用户使用文本提示创建高质量的4K全景4D内容，从而提供身临其境的虚拟游览体验。为了在没有高质量四维训练数据的情况下实现全景到四维的转换，他们将一般的二维先验模型整合到全景域中。

5 天

为什么无需 tokenizer 的新架构有很大的潜在价值？BLT 对多模态模型训练、推理会产生哪些影响？目前不同模态的对齐、融合常用的方法是什么？存在哪些难题？近期有哪些工作在解决不同模态差异方面指出了新的方向？这些工作旨在解决什么问题？

一些您可能无法访问的结果已被隐去。