搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
房地产
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
过去 30 天
时间不限
过去 1 小时
过去 24 小时
过去 7 天
按相关度排序
按时间排序
搜狐
9 天
DeepSeek-V3大揭秘:打破开源模型界限的AI新星
近期,深度求索公司推出的DeepSeek-V3模型引发了广泛关注,成为AI领域的新焦点。根据独立评测机构ArtificialAnalysis的评估,DeepSeek-V3被认为超越了 ...
站长之家
8 天
DeepSeek-V3 是怎么训练的|深度拆解
声明:本文来自于微信公众号 赛博禅心,作者:赛博禅心,授权站长之家转载发布。 这两天,DeepSeek-V3低调发布,在国际上狠狠秀了一波肌肉:只用了500多万美金的成本,带来了不输 Claude3.5的成绩,并开源! 下面,让我们以更加系统的方式,来看看这次的 DeepSeek-V3 ...
搜狐
8 天
DeepSeek-V3引发算力需求变革,A股算力股应如何应对?
近日,深度求索(DeepSeek)推出的DeepSeek-V3大模型在人工智能(AI)行业引起了广泛关注。此款参数量高达671B的大模型在预训练阶段仅花费557.6万美元,并使用2048块GPU训练了两个月。DeepSeek-V3的推出不仅展现了其在性能上与其他前沿大模型的竞争力,更可能对算力 ...
头部财经
8 天
DeepSeek:未授权任何人员参与机构投资者交流会
12 月 30 日消息,据财联社报道,近期,一份关于 DeepSeek 发布历程、优化方向的专家会议纪要文件在业内流传。对此,DeepSeek 回应称,公司未授权任何人员参与券商投资者交流会,所谓“DeepSeek 专家”非公司人员,所交流信息不实。 DeepSeek 表示,公司内部制定有 ...
搜狐
7 天
雷军挖角的95后“天才少女”是何方神圣?
国产大模型DeepSeek在全球火了,并带火了一个95后AI“天才少女”罗福莉。 最近,中国头部量化私募公司幻方量化旗下专注于AI大模型研究开发的Deepseek(深度求索公司),宣布旗下的全新系列模型DeepSeek-V3首个版本上线并同步开源。 DeepSeek-V3是深度求索自研的MoE ...
腾讯网
4 天
DeepSeek-V3:美国芯片封锁的“意外”产物?
用两个月、600万美元,就能训出一个能跟ChatGPT掰手腕的AI模型?Deepseek用实力演绎了“四两拨千斤”是什么意思。 幻方量化旗下的DeepSeek公司宣布 ...
36氪
4 天
DeepSeek-V3:美国芯片封锁的“意外”产物?
DeepSeek高效训练AI模型,减少硬件依赖。 继电动车、消费品之后,中国团队又在AI领域上演了一出“成本屠夫”的好戏。 用两个月、600万美元,就能 ...
IT之家
8 天
大模型 DeepSeek:未授权任何人员参与机构投资者交流会,网传交流 ...
IT之家12 月 30 日消息,据财联社报道,近期,一份关于 DeepSeek 发布历程、优化方向的专家会议纪要文件在业内流传。对此,DeepSeek 回应称,公司未授权任何人员参与券商投资者交流会,所谓“DeepSeek 专家”非公司人员,所交流信息不实。 DeepSeek 表示,公司内部 ...
站长之家
11 天
挑战开源AI新高度:DeepSeek V3超越Llama3.1,训练数据达14.8万亿token
中国人工智能公司DeepSeek日前发布了一款具有里程碑意义的开源大语言模型DeepSeek V3。这款拥有6710亿参数的模型不仅规模超越Meta的Llama3.1,在多项基准测试中的表现也优于包括GPT-4在内的主流封闭源模型。 DeepSeek V3的突出特点在于其强大的性能与高效的开发过程。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈