DeepSeek 的惊艳亮相,引发了全球对中国 AI 实力的重新评估,也与百度 CEO 李彦宏在世界政府峰会上的观点产生了共鸣。李彦宏认为创新无法被计划,但需要持续投入 AI 基础设施,才能处于技术前沿。DeepSeek 的成功正是 “有准备的头脑” 的体现,其在算力能效比上的突破,得益于幻方量化在 GPU 储备上的先见之明以及多头潜在注意力(MLA)和群组相对策略优化(GRPO)等技术的创新。这不仅是 DeepSeek 单点突破,更是中国大模型技术整体进步的体现,例如百度研发的检索增强技术(RAG)等。
DeepSeek 的成功也与成本下降密切相关。李彦宏强调,创新的本质是成本下降和生产力提升,而大模型推理成本的降低,正在推动 AI 应用的普及。百度智能云通过性能优化和架构创新,大幅降低了 DeepSeek 模型的调用成本,并提供限时免费服务,这迅速吸引了大量的客户。这种成本下降并非偶然,而是技术进步带来的结果,同时也得益于百度在 AI 基础设施上的持续投入,例如百舸 AI 异构计算平台 4.0 和昆仑芯三代万卡集群的建设。这些举措不仅降低了成本,更提升了训练和推理效率。
百度在 AI 领域的全栈布局也是其成功的关键。从芯片层的昆仑芯到模型层和应用层的布局,百度构建了一个完整的 AI 生态系统,这与其他公司依靠英伟达等芯片厂商形成对比。李彦宏强调了应用层价值创造的重要性,并以萝卜快跑为例,展示了 AI 在实际应用中的巨大潜力,也说明应用层跑通才能持续发展。DeepSeek 的成功以及百度在自动驾驶、文库等领域的应用,都印证了这一点。
总而言之,DeepSeek 的崛起并非偶然,它代表了中国 AI 在技术创新和成本控制上的突破。然而,这并不意味着可以减少对 AI 的投入。正如李彦宏所说,需要持续投入芯片、数据中心和云基础设施,才能打造下一代模型,并推动 AI 产业的可持续发展。DeepSeek 和百度都在为中国 AI 的未来持续投入,创造最佳可能的世界。