Liang Wenfeng Deepseek

近期，深度求索公司推出的DeepSeek-V3模型引发了广泛关注，成为AI领域的新焦点。根据独立评测机构ArtificialAnalysis的评估，DeepSeek-V3被认为超越了 ...

声明:本文来自于微信公众号赛博禅心，作者:赛博禅心，授权站长之家转载发布。这两天，DeepSeek-V3低调发布，在国际上狠狠秀了一波肌肉:只用了500多万美金的成本，带来了不输 Claude3.5的成绩，并开源! 下面，让我们以更加系统的方式，来看看这次的 DeepSeek-V3 ...

搜狐8 天

DeepSeek-V3引发算力需求变革，A股算力股应如何应对？

近日，深度求索（DeepSeek）推出的DeepSeek-V3大模型在人工智能（AI）行业引起了广泛关注。此款参数量高达671B的大模型在预训练阶段仅花费557.6万美元，并使用2048块GPU训练了两个月。DeepSeek-V3的推出不仅展现了其在性能上与其他前沿大模型的竞争力，更可能对算力 ...

头部财经8 天

DeepSeek：未授权任何人员参与机构投资者交流会

12 月 30 日消息，据财联社报道，近期，一份关于 DeepSeek 发布历程、优化方向的专家会议纪要文件在业内流传。对此，DeepSeek 回应称，公司未授权任何人员参与券商投资者交流会，所谓“DeepSeek 专家”非公司人员，所交流信息不实。 DeepSeek 表示，公司内部制定有 ...

搜狐7 天

雷军挖角的95后“天才少女”是何方神圣？

国产大模型DeepSeek在全球火了，并带火了一个95后AI“天才少女”罗福莉。最近，中国头部量化私募公司幻方量化旗下专注于AI大模型研究开发的Deepseek（深度求索公司），宣布旗下的全新系列模型DeepSeek-V3首个版本上线并同步开源。 DeepSeek-V3是深度求索自研的MoE ...

腾讯网4 天

DeepSeek-V3：美国芯片封锁的“意外”产物？

用两个月、600万美元，就能训出一个能跟ChatGPT掰手腕的AI模型？Deepseek用实力演绎了“四两拨千斤”是什么意思。幻方量化旗下的DeepSeek公司宣布 ...

36氪4 天

DeepSeek-V3：美国芯片封锁的“意外”产物？

DeepSeek高效训练AI模型，减少硬件依赖。继电动车、消费品之后，中国团队又在AI领域上演了一出“成本屠夫”的好戏。用两个月、600万美元，就能 ...

IT之家8 天

大模型 DeepSeek：未授权任何人员参与机构投资者交流会，网传交流 ...

IT之家12 月 30 日消息，据财联社报道，近期，一份关于 DeepSeek 发布历程、优化方向的专家会议纪要文件在业内流传。对此，DeepSeek 回应称，公司未授权任何人员参与券商投资者交流会，所谓“DeepSeek 专家”非公司人员，所交流信息不实。 DeepSeek 表示，公司内部 ...

站长之家11 天

挑战开源AI新高度:DeepSeek V3超越Llama3.1，训练数据达14.8万亿token

中国人工智能公司DeepSeek日前发布了一款具有里程碑意义的开源大语言模型DeepSeek V3。这款拥有6710亿参数的模型不仅规模超越Meta的Llama3.1，在多项基准测试中的表现也优于包括GPT-4在内的主流封闭源模型。 DeepSeek V3的突出特点在于其强大的性能与高效的开发过程。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果