作者|宋婉心
编辑|郑怀舟
春节期间,DeepSeek热潮席卷全球。A股DeepSeek概念大幅走强,每日互动、青云科技、安恒信息、天娱数科等多股,在春节后两个交易日连续涨停。
DeepSeek出现之前,“算力论”是大模型圈内的主流逻辑,DeepSeek以一己之力打破了它,证明模型能力与训练成本不一定成正相关关系。这是引起AI行业关注的主要原因。
数据显示,DeepSeek-V3训练成本只有Llama 3的1%,DeepSeek-R1推理成本只有OpenAI o1的3%。
由于算力逻辑受到冲击,DeepSeek成为华尔街“黑天鹅”,算力龙头英伟达及美股科技股在恐慌中暴跌。
1月27日,DeepSeek在中国区及美国区苹果App Store免费榜同时登顶。当晚开盘的美国科技股便集体大跌,费城半导体指数(SOX)下跌9.2%,创下2020年3月以来的最大跌幅,其中英伟达股价下跌近17%,市值蒸发近6000亿美元,规模创美股史上最大。
01 开源追上闭源
DeepSeek展现出来的核心竞争力,除了低成本及推理能力,更重要的是开源模型能力追赶上了最新的闭源模型。
据DeepSeek介绍,DeepSeek-R1在Codeforces、GPQA Diamond、MATH-500、MMLU、SWE-bench Verified等测试中,得分与o1正式版接近,部分测试中得分还超过o1正式版。而o1代表了目前最高水平的闭源模型。
Meta首席AI科学家Yann Lecun此前表示,DeepSeek-R1面世,并不是中国AI技术打败了美国,而是“开源的力量战胜了闭源模式”。
技术层面来看,R1模型放弃了RLHF的HF(人类反馈)部分,只留下RL(强化学习)部分,这个过程中模型涌现了反思能力。
英伟达高级研究科学家Jim Fan指出,DeepSeek-R1可能是第一个展示了RL(强化学习)飞轮可发挥作用且能带来持续增长的OSS(开源软件)项目。
行业普遍共识认为,在开源与闭源的竞争中,闭源模型的水平需要始终高于开源,是最基本的竞争门槛,不然用户没有理由付费使用一个更差的服务。
因此当开源大模型能力追赶上甚至超过闭源大模型能力时,开源对闭源将造成冲击。这也是DeepSeek引发美股科技股恐慌的主要原因之一。
DeepSeek开源且免费的压力之下,OpenAI也做出了相应调整。
2月1日,OpenAI发布o3-mini,这是OpenAI首个开放给免费用户的推理模型。OpenAI首席执行官Sam Altman还回应表示:“我个人认为,我们在这里站在了历史的错误一边,需要找出一个不同的开源策略。”
更早前,英伟达、亚马逊和微软三家巨头在1月31日同一天宣布接入DeepSeek-R1。
海内外AI界对DeepSeek的共同认可,以及其广泛传播度,在A股持续掀起DeepSeek概念股涨停潮。
从产业层面来看,多家券商表示,DeepSeek有望带动国内AI全产业的快速发展,同时其开源与低成本的特性亦有望赋能AI应用厂商,加速推动硬件终端AI落地。
从国产替代的层面来看,DeepSeek的创新从受美国芯片限制的背景下诞生,从而验证了国内AI产业从芯片上游到模型、应用下游的闭环是可实现的,大幅提振了AI国内产业链的信心。
02 资本开支不降反升
虽然DeepSeek的出现,让美股市场开始担忧算力需求见顶及AI资本开支将放缓的问题,但从美国各大厂最新指引来看,并没有减少资本开支的迹象。
在2月4日财报电话会上,谷歌预计今年资本开支将达到750亿美元 ,比市场预期高出32%;Meta则指引今年全年资本支出在600亿至650亿美元,同样远高于分析师513亿美元的预测。
微软在年初时表示今年资本开支将达到800亿美元,2024财年该数值为557亿美元。不过由于与OpenAI在AI发展理念上出现的分歧,微软正减少对OpenAI的追加投资。
最新消息是,去年11月OpenAI与甲骨文达成合作的“Stargate”项目,目标是推动AI基础设施发展,微软投资力度却低于预期。根据知情人士透露,这种调整可能源于微软在AI基础设施上的投资意愿下降,同时也为减轻部分AI支出压力。
而且今年1月20日,微软调整与OpenAI的合作协议,允许其使用竞争对手的云服务,削弱了原本的排他性。
有分析预计,2025年微软、Meta、亚马逊和谷歌的资本支出占其收入比例或高达22%,较2024年的17.2%进一步提高。
长期来看,DeepSeek的路线实际上助推了GPU需求的进一步增长。
微软首席执行官纳德拉在社交平台引用“杰文斯悖论”指出,提高资源使用效率反而可能增加其总消耗量。
即DeepSeek带来的计算成本持续下降,将降低AI应用门槛,应用普及则会刺激上游算力需求增长。
投行分析师Cantor Fitzgerald也在一份投资报告中指出:“我们认为担心GPU支出会达到峰值的观点并非事实。DeepSeek实际上对计算和英伟达非常有利。”
针对英伟达,多个分析师团队仍旧看多,花期Atif Malik团队维持了对英伟达的“买入”评级。
因此整体而言,DeepSeek冲击波的最终受害者,可能不是英伟达,而是OpenAI等大模型同行们。
关注获取更多资讯
友情提示
本站部分转载文章,皆来自互联网,仅供参考及分享,并不用于任何商业用途;版权归原作者所有,如涉及作品内容、版权和其他问题,请与本网联系,我们将在第一时间删除内容!
联系邮箱:1042463605@qq.com