千呼万唤始出来。
4月24日,DeepSeek“无预警”发布了新一代旗舰大模型DeepSeek-V4并开源。新模型在推理性能等方面比肩全球一流闭源模型,且延续其性价比优势,以极低的推理成本、标配的高性能长文本能力,引发广泛关注。
特别值得一提的是,DeepSeek此次上新,更强调与国产算力平台的深度适配。有分析指出,模型优先完成与华为昇腾等国产芯片的适配工作,将国产大模型与国产算力底座的协同推至新高。在国产芯片生态建设处于攻坚关键期的背景下,此举意义更为凸显。
巧合的是,前段时间,英伟达CEO黄仁勋在一次访谈中提到,如果DeepSeek新模型在中国AI硬件平台首发并实现最佳表现,模型的扩散会推动中国技术成为世界标准。
如今,DeepSeek-V4确实做出主动适配国产芯片的选择。这一选择并不轻松,因为相比成熟的国际生态,国产芯片在工具链、算子库以及系统协同等方面仍需持续完善。从训练到推理的全链路优化,往往意味着更长周期和更高投入,也意味着要在一段时期主动放弃“存在感”。
这种取舍,折射出一种难得的创新心态。
近两年,大模型行业模型上新频繁、融资消息不断,笼罩在“没消息就下牌桌”的紧张气氛中。在这样的环境里,DeepSeek的选择略显不同:过去长达15个月的时间,除了少数技术文章,团队鲜少发声,将精力集中于技术打磨。直到此番新模型发布,才集中释放阶段性成果。
这次发布中,团队引用《荀子》中的“不诱于誉,不恐于诽,率道而行,端然正己”,可视为对外界毁誉的一种回应。鲜花着锦或是烈火烹油,都不影响其锚定技术主方向,向着既定目标“率道而行”。
因此,DeepSeek-V4的推出,不仅是模型能力的跃升,更是中国科技创新的又一个生动注脚。
围绕国产算力深度适配,聚焦关键技术悉心打磨,所体现的,正是在复杂环境中保持战略定力、在关键处持续发力的创新姿态。
其中所传递出的,是一种不被短期评价裹挟的自觉。它意味着不为一时声音所动,在喧嚣中保持定力,也意味着敢于在眼前得失之外,押注那些真正重要的方向。
当越来越多的探索沿着这样的路径展开并显现成效,也将鼓励更多人“率道而行”,不断书写自主创新的“中国答卷”。