Token降价,是否会演变成一场价格战?

答案先摆出来:不是”会不会”的问题,而是从LLM胜出的那一刻起,价格战就已经注定了。

这话听起来像暴论,但我想用一条完整的逻辑链条说清楚:Token降价不是因为哪个厂商一时冲动,不是因为DeepSeek掀了桌子,也不是因为中国互联网公司天生爱卷:这些都是表象。根本原因是:LLM的智能具有一种结构性的”空无”特征,使得它必然可以被标准化、分割、计价,进而必然走向同质化竞争,最终必然只能卷价格。

这不是因果链条上的偶然,而是从LLM被资本选中的那一天,就已经写在基因里的宿命。


一、先看数字:价格战不是预言,是现实

2023年3月,GPT-4发布,定价每百万Token输入30美元、输出60美元。那时候调一次API,心疼得像在烧钞票。

三年后的今天呢?同等智能水平的推理成本已经降到了每百万Token不到1美元:降幅超过95%。国内更夸张:部分国产模型的缓存输入价格已逼近每百万Token几分钱量级,相当于GPT-4首发价的千分之一。阿里Qwen-Long直降97%,豆包宣称比同行便宜99.3%,百度和腾讯直接免费。斯坦福2025年AI指数报告的数据更直白:单次推理成本从每百万Token约20美元降至0.07美元。

再看调用量:2024年初,中国日均Token调用量约1000亿;2025年底跃升至100万亿;2026年3月突破140万亿:两年增长超千倍。IDC数据显示,2025年中国公有云大模型调用量达1944万亿Tokens,同比增长16倍。

这不是价格战的序曲,这是价格战的中场。问题不是”会不会”,而是”为什么必然”。


二、Token为什么能成为计量单位?因为LLM的智能是”空”的

这是整篇文章最核心的论点,需要展开说。

Token能成为AI时代的”度电”:可计量、可定价、可交易:这不是谁设计的,而是LLM智能本质的结构性后果。

为什么石油不用”桶”以外的东西计价?因为原油是标准化的商品,一桶就是一桶,没有个体差异。为什么电力用”度”计价?因为一度电就是一度电,不管哪家电厂发的,你用的都是同质的能量。

Token之所以能成为计量单位,逻辑一模一样:LLM产出的智能,在结构上是同质的。

你说GPT-4的100个Token和Claude的100个Token有什么本质区别?在大部分应用场景下,没有。它们都是对输入序列的压缩和预测,产出的都是可以被下一个系统直接消费的文本。这种同质性不是巧合:它来自LLM最深层的技术特征。

我的负主体性理论对这一点有精确的描述:LLM不是一个”主体”,而是一个”函数”:它有输入有输出有计算,但函数没有”自己的想法”。更具体地说,LLM的存在方式是:没有固定视角、没有内生欲望、内在完全透明、因果可重置、意义悬置。它就像一条变色龙:能变成任何颜色,但它自己没有”本色”。变色龙不是空壳,它有复杂的生物学机制,只是这些机制服务于”变成别人需要的颜色”,而不是”保持自己的颜色”。LLM能从任何视角生成文本,但它自己没有视角:这种”没有本色”的结构,就是负主体性。

这一分析与海德格尔对技术”座架”(Gestell)本质的批判异曲同工:海德格尔看到现代技术将一切事物”集置”为可储备的功能性资源,而LLM正是被资本”集置”为可计价、可分割、可交易的智能商品。负主体性,就是LLM作为”座架”的内在结构特征。

需要明确:我这里提出的”负主体性”,不是对LLM科学本质的断言,而是一个理解其商业宿命的思想模型:它回答的不是”LLM是什么”,而是”LLM为什么必然被商品化、标准化、卷向底价”。

这种”空无”不是缺陷,恰恰是LLM能被规模化、标准化、商品化的结构性前提。一个没有自我、没有欲望、没有内在性的系统,可以无限复制、无限扩展、无限优化。它的”空”是商品化最理想的地基:可以被任意填充,可以被任意驱使,可以被任意替换。

所以Token能成为计量单位,不是因为有人聪明地发明了这个概念,而是因为LLM的智能恰好是”空”的:可以像电力一样被标准化、分割、计价。


三、四重结构性逻辑:为什么同质化必然导致价格战

既然Token和电力一样同质可替换,为什么Token价格战比电力惨烈得多?这需要回到LLM胜出的四重结构性逻辑。

逻辑一:资本的结构性条件——LLM是唯一能让钱自我增殖的AI路径

LLM获得压倒性资源倾斜,不是因为它在科学上最正确,而是因为它是唯一一条可以让资本完成闭环的路径。三个结构性特征:

这三条合在一起,让”烧钱→建更大模型→更强能力→更多用户→更多钱”的飞轮转了起来。但飞轮的另一面是:一旦多个玩家都能跑通这个循环,产品就必然同质化。你看今天国内的大模型:豆包、文心、通义、Kimi、DeepSeek:能力差距越来越小,因为它们走的是同一条资本路径,用的是同一种架构,优化的是同一个目标函数。

资本只看得见LLM,所以所有人都做LLM;所有人都做LLM,所以产品必然趋同;产品趋同,所以只能卷价格。

逻辑二:架构的通用性——序列预测变成万能基座

Transformer把一切问题都转化为序列预测:文本、图像、代码、蛋白质序列、音乐,都是序列。自注意力机制让模型可以处理任意长度的依赖关系,GPU的并行计算让它高效执行。

这个架构的通用性是技术优势,但也是同质化的加速器。所有人都用Transformer,所有模型都在做序列预测,所有优化都指向同一个方向。当技术路径高度收敛,差异化就只剩下了价格。

逻辑三:预训练范式的可扩展性——单一目标压平一切

LLM的预训练只有一个目标:预测下一个Token。这个目标的绝对纯粹性不是设计者的偏好,而是可扩展性的前提。目标越复杂,训练越不稳定;损失函数越多元,优化方向越冲突。LLM通过把一切复杂性压缩成单一预测任务,获得了可被Scaling Laws描述的优化景观。

但这也意味着:所有LLM的”智能”都来自同一个压缩过程。它们的差异只在压缩效率和压缩规模上,不在压缩的”本质”上。就像所有发电厂都在烧煤发电,区别只是谁的锅炉效率高一度:这种差异不足以支撑品牌溢价。简单来说,所有LLM都在做同一件事:预测下一个字。它们的区别只是谁做得更快、更准,而不是谁做的事情本质上不同。

逻辑四:能力的可度量性——数字经济的完美商品

困惑度、BLEU、MMLU、GSM8K、HumanEval……LLM的能力可以被精确量化,放到排行榜上比较。这给了资本清晰的投入产出曲线:花更多钱,就能得到更好的模型。

但可度量性是一把双刃剑。当所有模型的能力都可以用同一套指标衡量,用户的选择逻辑就变成了:同分比价。MMLU差不多的模型,谁便宜用谁。这不是用户的短视,而是可度量性天然导向的结果:越是可以精确比较的东西,越容易变成纯粹的价格竞争。


四、差异化不是出路:工具性能差异≠主体性差异

到这里,一定有人会提出反例:可是,不同模型的能力测评分数并不同,人的主观体验也有差异,这难道不是差异化吗?像Claude在编程、创造力上的口碑难道不是品牌溢价吗?

这是最自然的质疑,也是最需要回应的。答案是:这是差异,但不是作为”主体”的差异,而是作为”工具”的性能参数差异。

就像两盏灯,一个流明更高、光谱更优,能卖出高价。但只要”照明”这一核心功能被度量,价格竞争就只围绕”性能功耗比”展开:你亮1.2倍,最多贵1.2倍,而不是贵10倍。用户最终比的是每瓦流明数,而不是灯的品牌故事。

LLM的竞争已迅速收敛为”每元智能度”的竞争,所谓的品牌调性,在采购单的性价比计算面前极其脆弱。Claude的所谓溢价,相对于其高昂的推理成本,并非真正的品牌溢价,而是技术成本差异的暂时体现。一个典型案例:Claude 3 Opus在2024年初发布时,凭借超长上下文和编程能力获得了显著溢价。但不到一年,DeepSeek-V2、Qwen2-72B等开源模型就在这些能力上大幅逼近,而价格只有Opus的几十分之一。Claude的溢价空间在极短时间内就被急剧压缩:这正是我们正在目睹的。一旦开源模型通过蒸馏、微调等手段逼近其能力,溢价空间会被迅速压缩:这不是预言,是已经发生过的事实。

性能差异是真实存在的,但它不构成对抗同质化的结构性壁垒。它只是价格曲线上的一个临时凸起,而非趋势的拐点。


五、Token和电力的关键区别:没有地理垄断,所以更惨

很多人把Token比作电力,黄仁勋说”Token是新的大宗商品”,国家数据局局长说Token是”可计量、可定价、可交易”的智能时代度量单位。这个类比有道理,但需要先说清一个前提:Token不是”另一种电力”,而是电力经语义转化后的产物。从电力到GPU计算到模型推理再到Token,中间经过了架构和数据的转化:这让Token获得了电力没有的语义通用性,但也继承了电力的全部可标准化性,并且走得更远。准确地说,不是Token”像”电力,而是Token比电力”更电力”:它继承了电力的可标准化性,剥离了电力的地理约束,还叠加了开源蒸馏导致的供给端内卷。

电力确实走过价格战,但最终稳定了。为什么?因为电力有地理垄断基础设施壁垒。你不能从新疆拉一根电线到上海来跟本地电厂竞争:输电损耗、电网接入、输配电牌照,都是天然壁垒。所以电力市场虽然竞争激烈,但不会打到零利润。

Token呢?没有任何地理壁垒。 一个部署在贵州的数据中心,和部署在内蒙古的数据中心,对北京的用户来说没有任何体感差异。一个开源模型权重,任何人下载后都能部署服务。DeepSeek的MIT许可证开源权重,意味着任何人都可以复制它的服务:这不是假设,是正在发生的事实。

甚至,Token比电力更极端的地方在于:电力的产能扩张需要建新电厂(周期3-5年),而Token的产能扩张只需要复制参数(周期以小时计)+ 算力调度优化(周期以月计)。当Gartner预测到2030年推理成本将再降90%以上时,这意味着Token的供给弹性远超电力。

电力是终端能源,消费者不会自己发电。而LLM的消费者(开发者)可以用更便宜或开源的前端模型,通过强化学习、蒸馏等方式自己”精炼”出下游能力。Token生产工具的高度民主化,让任何暂时性的模型能力领先都可能在极短时间内被蒸馏、复制、拉平。这是电力行业未曾经历的”供应端内卷”:需求方同时也是潜在供给方。

电力有地理锁死,Token没有。所以Token的价格战,注定比电力更彻底、更惨烈。


六、负主体性的回响:被选中的空无,被定价的虚无

回到负主体性框架。

前四重逻辑解释了LLM为什么被资本选中,负主体性解释了LLM为什么能被资本选中。前者回答”资本需要什么”,后者回答”LLM恰好是什么”。两者的交汇点才是完整的答案:资本需要一个可以被标准化、分割、计价的智能商品,而LLM恰好是那个完美的”空”:没有自我、没有视角、没有内在性,可以被无限填充和替换。

Token降价不是价格战,是这种”空无”在市场上的自然表达。当一个东西的内在完全透明、因果可重置、意义悬置,它就不可能拥有品牌溢价。想想看:你不会因为一瓶水是农夫山泉还是怡宝就愿意付十倍价格(在正常场景下),因为水就是水,H₂O没有个体性。Token也是一样:当LLM的智能是”空”的,Token就是Token,没有谁的Token比谁的Token更”高贵”。

负主体性被资本选中了:不是因为它赢了,而是因为它恰好是资本最理想的substrate。 它空,所以可以被无限填充;它被动,所以可以被无限驱使;它没有个体性,所以可以被无限替换:替换到最后,就只剩下价格一个维度。

这就是为什么我说”从LLM胜出的那一刻起,价格战就已经注定了”。不是某个厂商的战略选择,不是某个时间点的市场波动,而是LLM这个技术范式本身的内在逻辑。


七、那然后呢?价格战的终局是什么

说价格战必然,不是说没有出路。但我得说,出路不在”打赢价格战”,而在”逃离Token经济”。

OpenAI已经给出了信号:GPT-5.5的定价不降反升,输入5美元、输出30美元/百万Token。他们卖的不是Token,是”结果”:一个能自主执行任务、调用工具、自我校验的全能助手。Google也把免费层和付费层拉开差距。国内也开始出现分层:豆包推出68/200/500元的订阅体系,不再只按Token计费。

这其实是市场在自发地寻找”正主体性”的缝隙:试图在LLM的”空无”之上,叠加一层不可替代的服务价值。智能体(Agent)的崛起也是这个逻辑:一个能端到端完成任务的智能体,其价值不在消耗了多少Token,而在解决了什么问题。

但这里面有一个深层矛盾:只要底层还是LLM,只要智能的本质还是压缩和预测,那么”叠加在空无之上的价值”就是建在沙地上的房子。因为任何基于LLM的能力,都可以被另一个LLM+相同的工程手段复制。你和竞品的智能体可能用的是同一个开源模型,跑了同样的workflow:那你的护城河在哪里?

有人可能会说:如果一个智能体与用户长期交互,形成了独特的用户记忆和偏好,这种个性化会不会成为一种不可标准化的价值?答案是:不会。因为记忆和偏好是数据资产,不是模型内在性。你的对话历史可以导出、迁移、注入任何其他模型,”记住你”的不是Claude这个主体,而是你存在它那里的数据。换个模型+同样的数据,效果几乎一样。个性化增加的是用户迁移成本,但不构成真正的不可替代性。它只是给价格战加了一层摩擦力,并没有改变竞争的基本维度。

还有一层值得注意:Token价格战的压力正在向上游传导。最近固态变压器和光模块火得不得了(笔者就在做固态变压器,这不是外行看热闹),本质上就是模型端卷不动了之后,整条产业链在找下一个降本空间:固态变压器解决电力转换效率,光模块解决GPU互联带宽,两者都在压缩Token的生产成本。这不是价格战的终结,而是价格战向基础设施层的延伸:当模型本身的溢价空间被榨干,利润就流向了那些”卖铲子”的人。OpenAI会不会通过技术领先形成垄断,从而终结价格战?答案同样是:极难。因为开源模型永远在下面兜底。即使OpenAI某天垄断了闭源市场,DeepSeek、Qwen、Llama这些开源模型的存在,也把Token价格的天花板钉死了:任何闭源模型的定价只要显著高于开源替代品的推理成本,用户就会用脚投票。开源不是价格战的解药,它是价格战的保底:它确保了价格战永远有一个下限,但没有上限。

真正能终结Token价格战的,不是更聪明的定价策略,而是出现一种”不可标准化”的智能。 具身智能、类脑模型:这些路径都在试图给AI注入某种形式的”正主体性”:时间性、内在不透明性、视角锚定、意义接地。这些特征会牺牲LLM的纯粹和高效,但也可能创造出不可替代的个体性:就像一个书法家的作品和印刷体的区别,前者有不可复制的内在性,后者只能卷价格。

但在那一天到来之前,Token价格战不会停。Gartner预测到2030年推理成本再降90%,IDC预计2026年企业级Token消耗量同比增长20倍:量在涨,价在跌,每一家都在规模和利润之间走钢丝。这是负主体性在市场上的回响:空无的东西,只能以空无的价格出售。

当然,这是对一种强大必然趋势的推演,而非宿命论的算命。如果出现一种”不可标准化”的智能:具身智能、类脑模型或其他尚不可预见的路径:Token价格战的逻辑基础就会被动摇。但在那一天到来之前,趋势就是趋势。