微软近期在 Hugging Face 平台上发布了名为 Phi-4的小型语言模型,这款模型的参数量仅为140亿,但在多项性能测试中表现出色,超越了众多知名模型,包括 OpenAI 的 GPT-4o 及其他同类开源模型如 Qwen2.5和 Llama-3.1。
然而,受企业特性、市场环境和金融支持等因素的影响,我国开源企业的商业价值尚未充分体现。建议有关部门从加大政策支持力度、加速重点领域布局、发挥应用牵引作用、畅通企业融资渠道四个方面释放积极信号,助推开源企业商业价值兑现取得新突破,促进企业 科技创新 和健康发展,为新质生产力发展注入创新活力和增长动力。
老黄所说的行业范围包含了软件工程师以及背后的公司和业务。基于此,英伟达推出了一个名为“NVIDIA Cosmos”的世界基础模型,这是一种帮助 AI 理解现实世界的基础平台,它能够接受文本、图像和视频信息,包含生成世界基础模型、高级分词器、视频加速处理通道等,并生成虚拟的世界图像。
在性能上,Llama Nemotron模型经过精简和训练,采用了英伟达的最新技术和高质量数据集。它们在指令跟踪、聊天、函数调用、编码和数学方面表现出色,同时进行了大小优化,可在英伟达广泛的加速计算资源上运行。
在2025年国际消费电子展 (CES)上,英伟达CEO黄仁勋首次公布了新一代GeForce RTX 50系列显卡,令玩家和创作者翘首以盼。这一系列显卡以Blackwell架构为基础,标志着显卡技术的又一次重大跃进,显然再度引发了行业的热议。
近日,英伟达正式推出了其最新的Llama Nemotron语言基础模型,此次发布的模型分为Nano、Super和Ultra三个版本,旨在满足不同层次用户的需求。作为当前人工智能技术的一个重要进展,Llama Nemotron将带来更强大的自然语言处理能力,推动各行业的智能化发展。新模型的引入,预计将重塑AI应用的潜力,吸引了众多开发者和企业的关注。
其中最重要的创新是提出了一种新型注意力,在Transformer架构的基础上,用MLA(Multi-head Latent Attention)替代了传统的多头注意力,大幅减少了计算量和推理显存。 DeepSeek-V2发布前三个月,DeepSeek ...
在科技界引发轰动的最新消息中,EXO Labs成功地在一台拥有26年历史的Windows 98系统上运行了大型语言模型(LLM)。这一壮举不仅展示了技术的非凡能力,也彰显了EXO团队对于“民主化AI”理念的执着追求。 EXO ...
快科技12月30日消息,据媒体报道,EXO Labs最近发布了一段视频,展示了在一台26年历史的Windows 98奔腾2 PC上运行大模型(LLM)。 这台主频350MHz电脑成功启动进入Windows 98系统,随后EXO启动了基于Andrej ...
Hugging Face官方发文,开源了扩展测试时计算的方法。 用在小小小模型Llama 1B上,数学分数直接超过8倍大的模型,也超过了计算机科学博士生的平均 ...
然而,高性能模型通常伴随着高昂的计算成本和技术门槛,这让许多开发者和小型企业望而却步。针对这一痛点,Meta AI 推出了全新开源语言模型 Llama 3.3。它不仅显著降低了成本,还在性能和易用性上实现了突破,让先进的自然语言处理(NLP)技术真正走向大众。