Liang Wenfeng Deepseek

声明:本文来自于微信公众号赛博禅心，作者:赛博禅心，授权站长之家转载发布。这两天，DeepSeek-V3低调发布，在国际上狠狠秀了一波肌肉:只用了500多万美金的成本，带来了不输 Claude3.5的成绩，并开源! 下面，让我们以更加系统的方式，来看看这次的 DeepSeek-V3 ...

搜狐5 天

DeepSeek-V3引发算力需求变革，A股算力股应如何应对？

近日，深度求索（DeepSeek）推出的DeepSeek-V3大模型在人工智能（AI）行业引起了广泛关注。此款参数量高达671B的大模型在预训练阶段仅花费557.6万美元，并使用2048块GPU训练了两个月。DeepSeek-V3的推出不仅展现了其在性能上与其他前沿大模型的竞争力，更可能对算力 ...

搜狐6 天

95后AI“天才少女”刷屏！雷军千万年薪挖角！

与DeepSeek一起进入大家视野的，是95后AI“天才少女”罗福莉。她曾在DeepSeek参与了DeepSeek-V2的研发，是这款模型的关键开发者之一。在DeepSeek-V3发布前几天，媒体报道称小米创始人雷军已开出千万年薪，将罗福莉招至麾下，罗福莉将就职于小米AI实验室，领导大 ...

虎嗅网5 天

深度拆解：DeepSeek-V3是怎么训练的

这两天，DeepSeek-V3 低调发布，在国际上狠狠秀了一波肌肉：只用了 500 多万美金的成本，带来了不输 Claude 3.5 的成绩，并开源！下面，让我们以更加系统的方式，来看看这次的 DeepSeek-V3，是这么炼成的。本文将从性能、架构、工程、预训练和后训练五个维度来 ...

头部财经5 天

DeepSeek：未授权任何人员参与机构投资者交流会

12 月 30 日消息，据财联社报道，近期，一份关于 DeepSeek 发布历程、优化方向的专家会议纪要文件在业内流传。对此，DeepSeek 回应称，公司未授权任何人员参与券商投资者交流会，所谓“DeepSeek 专家”非公司人员，所交流信息不实。 DeepSeek 表示，公司内部制定有 ...

中华网4 天

DeepSeek-V3自称ChatGPT 模型识别出错引发讨论

DeepSeek-V3自称ChatGPT。12月26日，杭州深度求索人工智能基础技术研究有限公司宣布，其全新系列模型DeepSeek-V3首个版本上线并同步开源。该公司表示，DeepSeek-V3在多项评测中的表现超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型，并且性能与世界顶尖的闭源模型GPT-4o及 ...

IT之家5 天

大模型 DeepSeek：未授权任何人员参与机构投资者交流会，网传交流 ...

IT之家12 月 30 日消息，据财联社报道，近期，一份关于 DeepSeek 发布历程、优化方向的专家会议纪要文件在业内流传。对此，DeepSeek 回应称，公司未授权任何人员参与券商投资者交流会，所谓“DeepSeek 专家”非公司人员，所交流信息不实。 DeepSeek 表示，公司内部 ...

腾讯网5 天

DeepSeek：未授权任何人员参与机构投资者交流会

IT之家 12 月 30 日消息，据财联社报道，近期，一份关于 DeepSeek 发布历程、优化方向的专家会议纪要文件在业内流传。对此，DeepSeek 回应称，公司未 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果