深度求索DeepSeek-V3模型在业界掀起波澜。据悉,该模型采用数据蒸馏技术,将复杂数据简化为高质量数据,提升了训练效果。然而,有学者指出,蒸馏技术虽能提高效率,但可能导致“学生模型”无法超越“教师模型”,甚至影响创新。此外,DeepSeek-V3 ...