您的位置:首页 > 深度调查

DeepSeek如何撼动全球AI市场

2025年02月11日 17:14:23 来源:中国城市报 作者:中国城市报记者 孙雪霏

近期,中国人工智能初创企业——深度求索公司(DeepSeek)凭借其开源大模型R1及前代V3,成为撬动全球科技版图的一把“新杠杆”。与硅谷“烧钱堆算力”不同,DeepSeek通过算法革命将模型训练成本降低了约60%,仅以557.6万美元的纯算力投入实现了性能对标GPT-4o的成绩,并以开源策略吸引全球开发者目光。业内人士普遍认为,“低成本、高精度”正在冲击着以美欧企业为中心的AI叙事与竞争规则。

在这一背景下,从华尔街资本市场剧烈震荡,到微软、华为等巨头火速适配DeepSeek的产品,“DeepSeek现象”早已不仅是一场新兴技术突围的故事,更成为国际科技竞争格局重塑的观察窗口。它正向人们提出了新的问题——当中国AI企业以算法创新突围,全球AI赛道是否将迎来全新的规则重估?

崭露头角:

性能卓越,用户体验佳

“起初以为又是炒作概念的AI产品,现在想想还是不可思议。”某科技公司数据分析师高天宇向中国城市报记者展示他手机端的DeepSeek应用界面时,依然难掩惊喜。作为一名95后科技爱好者,他在两个月前偶然试用DeepSeek,原本想做一次简单的新能源汽车市场分析,没想到一段关于近五年政策变化的深度解析瞬间改变了他的看法。

“当时要准备行业报告,就随口让DeepSeek梳理近五年新能源汽车相关的中央及地方政策。”高天宇回忆道,“它先列出12项关键政策,然后结合动态数据模型,逐层推演对产业链的影响,最终还得出了‘2025年电池技术迭代窗口期’的观点。这个系统层层递进的逻辑让人眼前一亮,就像有个专家团队在帮我拆解问题,很多视角比专业咨询报告还透彻。”

现在,小高的工作界面里常驻两个窗口——Excel和DeepSeek。他告诉中国城市报记者,平时撰写材料会用DeepSeek来核对数据口径,处理客户需求时则让它生成备选方案,甚至做PPT也会先让AI搭好框架。“上周有个项目需要处理200份问卷的数据,它用交叉分析法三分钟就找出了潜在矛盾点,以往得折腾半天。”他打开工作日志,指着最近三个月的效率曲线,“项目交付效率整整提升了40%。”

更让小高意外的是,这个“智能助手”无形中还拓宽了他的知识面。“前天分析长三角产业转移,它又列举德国鲁尔区转型案例,提醒我关注技术工人流动数据。现在遇到复杂问题不先问问DeepSeek,总觉得缺了道‘保险栓’。”说着,他又习惯性地点开DeepSeek,“这满屏的行业术语和本土数据,优势可不只是技术参数能体现的。咱们的‘东方力量’,真不比ChatGPT差!”

DeepSeek是啥

DeepSeek背后的核心研发力量,最初源自幻方量化在GPU训练量化交易模型方面的经验。幻方量化是国内率先囤积过万块高端GPU用于大模型研发的企业之一,GPU储备规模甚至比肩国内一线互联网公司,远超国内主流大模型创业团队。

DeepSeek在海外“出圈”,始于2024年12月的一系列重量级发布。当月,公司推出了开源模型DeepSeek-V3,测试显示该模型在多项评测中优于主流开源方案,并且在保持高水准的同时具备明显的成本优势。其能力可与闭源的GPT-4o相近,但训练只用了2048张英伟达H800 AI芯片,纯算力成本仅为557.6万美元,比Meta发布的Llama-3-405B的一个训练周期还低了一个数量级。

时间进入2025年1月,DeepSeek发布了对标OpenAI最新推理模型o1的DeepSeek-R1,号称在数学、代码、自然语言推理等任务上实现了新的“自发涌现”式推理能力,并将其免费开源。与此形成鲜明对比的是,OpenAI、英伟达等巨头正酝酿大规模算力基建计划,涉及高达5000亿美元的投资。这样一来,DeepSeek的“纯算法”打法令全球行业目光纷纷聚焦。

北京邮电大学人工智能学院人机交互与认知工程实验室主任刘伟向中国城市报记者表示,DeepSeek的关键在于算法层面的突破和优化,大幅节省了算力与数据需求。“如果说OpenAI是‘大力出奇迹’,DeepSeek则证明‘小力也能出奇迹’。”在产业普遍受到算力和资源限制的当下,这种思路无疑展现出可观的竞争力。

市场反应:

美国科技股估值回调,

源于对算力霸权的质疑

DeepSeek系列模型推出后,如同在市场上投下一枚“震撼弹”,直接导致以英伟达为代表的美国科技股出现大幅波动。相比之下,国内AI产业界对DeepSeek训练成本低的消息并不感到意外。

一位头部大模型公司技术负责人向中国城市报记者分析:“557.6万美元只是单次训练纯算力成本;如果要加上预实验、数据清洗等流程,实际成本肯定要翻倍。但无论如何,相比国外闭源大模型,它依旧保持了极强的成本控制力。而且随着时间推移,后来者总比先驱更具成本优势,尤其在算法和数据管理上会更为成熟。”

《大西洋月刊》CEO汤普森表示,中国的开源模型在使用相对较少数据进行训练的情况下,也能产出与OpenAI或Claude相当的效果,这对于减少能耗、提高效率具有重要意义。

事实上,国内大模型创业公司普遍在算力、资金方面面临严峻限制,因而更倾向在软件、算法和工程优化层面寻找突破。DeepSeek独辟蹊径,通过更高效的计算拓扑和模型结构设计,在保持相近性能的情况下,把算力成本砍掉近60%。“别人用100元训练,DeepSeek用40元就能搞定,很多投资人一下子看到了大模型企业的新思路。”一位业内资深分析师评价道,“这不只是技术路线的博弈,更重要的是为打破硅谷——华尔街联合主导的AI叙事,打开了一条新通道。”

DeepSeek的问世被外界比喻为神秘的东方力量。“在极其有限的资源条件下,通过算法层面的精心设计反超对手,展现了中国工程师文化与成本意识的双重优势。”该分析师同时指出,DeepSeek的成功为业界提供了一个关键启示:在基础硬件和数据资源都有限的前提下,如何通过算法和工程能力实现质的飞跃,是未来AI大模型产业亟待解决的核心命题。

硅谷巨头的技术路径被挑战

Meta内部一位工程师在公司员工社区中直言:“DeepSeek极低的训练成本,让管理层开始担忧此前投入数百亿美元进行生成式AI研发的必要性。”当“烧钱堆算力”不再是唯一可行道路,新创企业与巨头之间的鸿沟便不再泾渭分明。深层次来看,DeepSeek以“省钱省力”的方式取得媲美GPT-4o、o1的模型表现,其背后是一场工程实用主义对技术理想主义的冲击。

在OpenAI、甲骨文、英伟达等联合宣布启动高达5000亿美元算力基建计划的节骨眼上,DeepSeek却用不到六成成本训练出同等规模和精度的大模型,不仅为“重资产”的美国AI生态敲响了警钟,更令他们对硬件与资金堆积模式的前景产生疑虑。国内一家大型科技公司的AI研究负责人接受采访时表示:“当工程优化带来的边际收益远高于单纯加芯片的线性增长,硅谷多年来赖以维系的技术优势就需要重新评估。”

换言之,DeepSeek的出现也挑战了美国AI巨头在资本与市场层面的叙事框架。对于真正需要盈利和长期发展的企业而言,控制成本、提高效率、获得更高社会接受度才是硬道理。

“我们当然为这一突破感到自豪,但也要保持清醒。”该国内大型科技公司负责人称,“不是每一家企业都能像OpenAI或xAI一样,一轮就融到几十亿美元。DeepSeek的路线具有极强的实用价值,对那些资金链并不充裕的AI企业而言,这无疑是一种更现实的突围方式。”

跨国科技企业争相适配 抢滩DeepSeek生态

当华尔街与硅谷仍在激辩DeepSeek的冲击时,国际科技巨头们已率先行动,与DeepSeek-R1模型实现了快速对接。2月7日之前,英伟达、微软、亚马逊、华为云、腾讯云等行业领军企业已密集推出了基于DeepSeek模型的产品或服务,以期分食这一快速增长的用户市场。

DeepSeek之所以在短时间内获得全球性拥抱,关键原因在于其模型全面开源,并兼容主流硬件与软件平台。全球各大云厂商与芯片厂商都希望藉由DeepSeek快速增长的人气,扩大自身生态体系的影响力。

天数智芯相关负责人向中国城市报记者表示,DeepSeek与国内自主GPU适配的工作持续推进,不仅能实现更高效的深度学习框架融合,同时也能减少对国外硬件平台的依赖。“这对国内人工智能产业链的自主可控意义深远。未来随着DeepSeek模型的进一步升级,加之硬件与软件的协同优化,AI应用落地的门槛将被大大降低。”

在受访专家看来,DeepSeek的热度并非昙花一现,而是背后蕴含了“算法革命”与“应用落地”的双重价值。一方面,通过对模型结构与训练流程的改进,DeepSeek在性能与成本之间找到了更优解;另一方面,开源策略吸引全球开发者贡献力量,形成“反哺”式生态,进一步推动算法演进与商业化落地。

《中国城市报》(2025年02月10日第11版)

责任编辑:越玥
  • 人工智能
欢迎关注中国城市报微信号
分享到: 

关于我们

城市服务

报社业务


网站备案号:京ICP备15005404号-4 京公网安备 11010502043907号
互联网新闻信息服务许可证10120190005 举报邮箱: jubao@people.cn  违法和不良信息举报电话: 010-65367114  010-65363263 地址:北京市金台西路2号人民日报社 邮编 100733

《中国城市报》社有限公司版权所有,未经书面授权禁止使用

Copyright © 2015-2025 by www.zgcsb.com. all rights reserved