我曾在八年前关注过中兴的故事,当时发生了灾难——美国全面禁令立即停止了它。拥有8万名员工、收入超过万亿人民币的公司,在一天之内从地图上消失了。场景令人痛心:没有高通的芯片,没有安卓的许可。故事以14亿美元的和解金和每年70亿人民币的损失告终。



但2026年2月发生的事情完全不同。DeepSeek宣布了V4多模态模型,将完全依赖国产芯片,没有NVIDIA。市场的第一反应是怀疑,但在这个公告背后隐藏着更深层次的问题:中国如何建立真正的计算自主权?

事实是,压垮中国人工智能公司的,不仅仅是芯片。是CUDA——NVIDIA自2006年以来垄断整个生态系统的平台。全球超过450万开发者与之关联,他们写的每一行代码都在加深鸿沟。当美国对A100、H100、H20实施禁令时,中国公司意识到,真正的问题不在芯片,而在整个软件环境。

但有出路。从2024年底到2025年,中国公司采取了完全不同的策略:混合专家模型。思路很简单——不激活整个模型,而是将其拆分为多个专家,只激活与任务最相关的部分。DeepSeek V3就是一个典型例子:拥有6710亿参数,但只激活370亿,即5.5%。训练成本?557.6万美元,而GPT-4则需7800万美元。差距巨大。

这种算法的进步直接反映在价格上。DeepSeek的接口每百万字符收费0.028美元,而GPT-4则为5美元。许可成本低25到75倍。到2026年2月,使用国产模型在OpenRouter上的调用增长了127%,仅用三周时间,首次超过美国。

但降低推理成本并不能解决训练的问题——这是计算能力的黑洞。训练“挖掘机”从何而来?

答案在中国东南部的一个小城。2025年,仅用180天就建成了一条完整的计算生产线。龙芯3C6000处理器和太初元气的T100显卡——全都国产。产量:每五分钟一台服务器。更重要的是?这些芯片开始训练真正的大模型。智谱AI用国产芯片训练了完整的GLM-Image。通信公司用数万处理单元在本地计算池中训练了其庞大的模型。

这不是推理——这是训练。一个质的飞跃。

背后是华为昇腾。到2025年底,开发者超过400万,合作伙伴超过3000家。43个主要模型在昇腾上训练完成。2026年3月,华为在海外市场推出了SuperPoD。昇腾910B的算力达到了NVIDIA的A100水平。差距从无法使用变成了可用。

而美国正面临真正的电力危机——弗吉尼亚、乔治亚、伊利诺伊暂停了新建数据中心项目。到2030年,能源消耗可能占到美国电力的12%,电网已然捉襟见肘。

另一方面,中国的电力产出是美国的2.5倍,工业用电价格仅为0.03美元——美国的四分之一。这意味着巨大的发电能力可以用来进行大规模计算。

如今,中国的人工智能正悄然走向世界——但不是产品或工厂。它输出的是符号(Token)。模型处理的小信息单元,已成为一种新的数字商品。在计算工厂生产,经过海底电缆传输到全球。

DeepSeek用户的分布说明了一切:中国占30.7%,印度13.6%,印尼6.9%,美国4.3%。支持37种语言。到2025年,58%的AI创业公司将DeepSeek纳入其技术架构。在中国,市场份额高达89%。

这让我想起四十年前的另一场战争。1986年,日本在美国压力下签署了半导体协议。那时正处于巅峰——到1988年,控制了全球市场的51%。但签署协议后,一切都变了。如今,它的份额已降至仅7%。巨头们一个接一个退出。

日本的悲剧在于,它接受了成为全球分工体系中最优产品的角色,却没有建立自主体系。当浪潮退去,它只剩下了生产。

今天的中国也站在类似但不同的十字路口。我们面临巨大压力——三轮芯片禁令不断升级。但这一次,我们选择了更艰难的道路:在算法层面进行极致优化,推动国产芯片从推理到训练的跃升,积累数百万开发者加入昇腾体系,然后在新兴市场推广Token的全球化。

每一步都在构建一个中国从未拥有的工业体系。

2026年2月27日,同一天,三家国产芯片公司公布了它们的成果。一半是火,一半是水。火的是收入,增长分别为453%、243%和121%。水的是亏损,总额达十亿八千万美元。每一笔亏损,都是为了打造一个自主生态系统的真实投入——研发、软件支持、现场工程师逐一解决问题。

这不是管理不善的亏损,而是必经的战争代价。

八年前,我们还在问:我们还能坚持吗?今天,问题变成了:我们要付出多少才能坚持?代价其实就是进步。
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 回覆
  • 轉發
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
暫無回覆