搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
房地产
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
过去 30 天
时间不限
过去 1 小时
过去 24 小时
过去 7 天
按相关度排序
按时间排序
站长之家
5 天
DeepSeek-V3 是怎么训练的|深度拆解
声明:本文来自于微信公众号 赛博禅心,作者:赛博禅心,授权站长之家转载发布。 这两天,DeepSeek-V3低调发布,在国际上狠狠秀了一波肌肉:只用了500多万美金的成本,带来了不输 Claude3.5的成绩,并开源! 下面,让我们以更加系统的方式,来看看这次的 DeepSeek-V3 ...
搜狐
5 天
DeepSeek-V3引发算力需求变革,A股算力股应如何应对?
近日,深度求索(DeepSeek)推出的DeepSeek-V3大模型在人工智能(AI)行业引起了广泛关注。此款参数量高达671B的大模型在预训练阶段仅花费557.6万美元,并使用2048块GPU训练了两个月。DeepSeek-V3的推出不仅展现了其在性能上与其他前沿大模型的竞争力,更可能对算力 ...
搜狐
6 天
95后AI“天才少女”刷屏!雷军千万年薪挖角!
与DeepSeek一起进入大家视野的,是95后AI“天才少女”罗福莉。她曾在DeepSeek参与了DeepSeek-V2的研发,是这款模型的关键开发者之一。在DeepSeek-V3发布前几天,媒体报道称小米创始人雷军已开出千万年薪,将罗福莉招至麾下,罗福莉将就职于小米AI实验室,领导大 ...
虎嗅网
5 天
深度拆解:DeepSeek-V3是怎么训练的
这两天,DeepSeek-V3 低调发布,在国际上狠狠秀了一波肌肉:只用了 500 多万美金的成本,带来了不输 Claude 3.5 的成绩,并开源! 下面,让我们以更加系统的方式,来看看这次的 DeepSeek-V3,是这么炼成的。本文将从性能、架构、工程、预训练和后训练五个维度来 ...
头部财经
5 天
DeepSeek:未授权任何人员参与机构投资者交流会
12 月 30 日消息,据财联社报道,近期,一份关于 DeepSeek 发布历程、优化方向的专家会议纪要文件在业内流传。对此,DeepSeek 回应称,公司未授权任何人员参与券商投资者交流会,所谓“DeepSeek 专家”非公司人员,所交流信息不实。 DeepSeek 表示,公司内部制定有 ...
中华网
4 天
DeepSeek-V3自称ChatGPT 模型识别出错引发讨论
DeepSeek-V3自称ChatGPT。12月26日,杭州深度求索人工智能基础技术研究有限公司宣布,其全新系列模型DeepSeek-V3首个版本上线并同步开源。该公司表示,DeepSeek-V3在多项评测中的表现超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并且性能与世界顶尖的闭源模型GPT-4o及 ...
IT之家
5 天
大模型 DeepSeek:未授权任何人员参与机构投资者交流会,网传交流 ...
IT之家12 月 30 日消息,据财联社报道,近期,一份关于 DeepSeek 发布历程、优化方向的专家会议纪要文件在业内流传。对此,DeepSeek 回应称,公司未授权任何人员参与券商投资者交流会,所谓“DeepSeek 专家”非公司人员,所交流信息不实。 DeepSeek 表示,公司内部 ...
腾讯网
5 天
DeepSeek:未授权任何人员参与机构投资者交流会
IT之家 12 月 30 日消息,据财联社报道,近期,一份关于 DeepSeek 发布历程、优化方向的专家会议纪要文件在业内流传。对此,DeepSeek 回应称,公司未 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈