老黄说:下一个时代,是"代理式AI"的时代 ...
英伟达首席执行官黄仁勋在一个座无虚席的场馆为CES拉开了序幕。黄仁勋展示的产品从显卡芯片到英伟达AI超级计算机,在2025年的科技圈中扔下了一枚枚“重磅炸弹”。
值得关注的是,在此次演讲的核心部分,黄仁勋按计划揭晓了英伟达最新一代电脑图形处理器——GeForce RTX 50系列,为现场及线上观众带来了诸多惊喜。 Notice: The content above (including the videos, ...
老黄所说的行业范围包含了软件工程师以及背后的公司和业务。基于此,英伟达推出了一个名为“NVIDIA Cosmos”的世界基础模型,这是一种帮助 AI 理解现实世界的基础平台,它能够接受文本、图像和视频信息,包含生成世界基础模型、高级分词器、视频加速处理通道等,并生成虚拟的世界图像。
在2025年国际消费电子展 (CES)上,英伟达CEO黄仁勋首次公布了新一代GeForce RTX 50系列显卡,令玩家和创作者翘首以盼。这一系列显卡以Blackwell架构为基础,标志着显卡技术的又一次重大跃进,显然再度引发了行业的热议。
近日,英伟达正式推出了其最新的Llama Nemotron语言基础模型,此次发布的模型分为Nano、Super和Ultra三个版本,旨在满足不同层次用户的需求。作为当前人工智能技术的一个重要进展,Llama Nemotron将带来更强大的自然语言处理能力,推动各行业的智能化发展。新模型的引入,预计将重塑AI应用的潜力,吸引了众多开发者和企业的关注。
而 Facebook 是一个成立 20 年,坐拥 30 亿月活的真·社交媒体平台。“让 AI 真正存在于我们的平台上”会让 Facebook 上, 既有真人账号,又有仿真账号,形成一种混合状态。 Meta 在 AI 上决心非常坚决。自研的开源大模型 ...
其中最重要的创新是提出了一种新型注意力,在Transformer架构的基础上,用MLA(Multi-head Latent Attention)替代了传统的多头注意力,大幅减少了计算量和推理显存。 DeepSeek-V2发布前三个月,DeepSeek ...
使用260K LLM和Llama架构在Windows 98上实现了“35.9 tok/s”的速度,根据EXO的博客,升级到15M LLM后,生成速度略高于1 tok/s,Llama 3.2 1B的速度则慢得多,为0.0093 tok/s。
在科技界引发轰动的最新消息中,EXO Labs成功地在一台拥有26年历史的Windows 98系统上运行了大型语言模型(LLM)。这一壮举不仅展示了技术的非凡能力,也彰显了EXO团队对于“民主化AI”理念的执着追求。 EXO ...
Hugging Face官方发文,开源了扩展测试时计算的方法。 用在小小小模型Llama 1B上,数学分数直接超过8倍大的模型,也超过了计算机科学博士生的平均 ...
然而,高性能模型通常伴随着高昂的计算成本和技术门槛,这让许多开发者和小型企业望而却步。针对这一痛点,Meta AI 推出了全新开源语言模型 Llama 3.3。它不仅显著降低了成本,还在性能和易用性上实现了突破,让先进的自然语言处理(NLP)技术真正走向大众。