DeepSeek 的崛起：中国 AI 的成本革命与持续投入

author 2025-02-16 共19人围观，发现0个评论人工智能 AI 大模型深度学习机器学习

DeepSeek 的惊艳亮相，引发了全球对中国 AI 实力的重新评估，也与百度 CEO 李彦宏在世界政府峰会上的观点产生了共鸣。李彦宏认为创新无法被计划，但需要持续投入 AI 基础设施，才能处于技术前沿。DeepSeek 的成功正是 “有准备的头脑” 的体现，其在算力能效比上的突破，得益于幻方量化在 GPU 储备上的先见之明以及多头潜在注意力（MLA）和群组相对策略优化（GRPO）等技术的创新。这不仅是 DeepSeek 单点突破，更是中国大模型技术整体进步的体现，例如百度研发的检索增强技术（RAG）等。

DeepSeek 的成功也与成本下降密切相关。李彦宏强调，创新的本质是成本下降和生产力提升，而大模型推理成本的降低，正在推动 AI 应用的普及。百度智能云通过性能优化和架构创新，大幅降低了 DeepSeek 模型的调用成本，并提供限时免费服务，这迅速吸引了大量的客户。这种成本下降并非偶然，而是技术进步带来的结果，同时也得益于百度在 AI 基础设施上的持续投入，例如百舸 AI 异构计算平台 4.0 和昆仑芯三代万卡集群的建设。这些举措不仅降低了成本，更提升了训练和推理效率。

百度在 AI 领域的全栈布局也是其成功的关键。从芯片层的昆仑芯到模型层和应用层的布局，百度构建了一个完整的 AI 生态系统，这与其他公司依靠英伟达等芯片厂商形成对比。李彦宏强调了应用层价值创造的重要性，并以萝卜快跑为例，展示了 AI 在实际应用中的巨大潜力，也说明应用层跑通才能持续发展。DeepSeek 的成功以及百度在自动驾驶、文库等领域的应用，都印证了这一点。

总而言之，DeepSeek 的崛起并非偶然，它代表了中国 AI 在技术创新和成本控制上的突破。然而，这并不意味着可以减少对 AI 的投入。正如李彦宏所说，需要持续投入芯片、数据中心和云基础设施，才能打造下一代模型，并推动 AI 产业的可持续发展。DeepSeek 和百度都在为中国 AI 的未来持续投入，创造最佳可能的世界。