Token降价，是否会演变成一场价格战？

答案先摆出来：不是”会不会”的问题，而是从LLM胜出的那一刻起，价格战就已经注定了。

这话听起来像暴论，但我想用一条完整的逻辑链条说清楚：Token降价不是因为哪个厂商一时冲动，不是因为DeepSeek掀了桌子，也不是因为中国互联网公司天生爱卷：这些都是表象。根本原因是：LLM的智能具有一种结构性的”空无”特征，使得它必然可以被标准化、分割、计价，进而必然走向同质化竞争，最终必然只能卷价格。

这不是因果链条上的偶然，而是从LLM被资本选中的那一天，就已经写在基因里的宿命。

一、先看数字：价格战不是预言，是现实

2023年3月，GPT-4发布，定价每百万Token输入30美元、输出60美元。那时候调一次API，心疼得像在烧钞票。

三年后的今天呢？同等智能水平的推理成本已经降到了每百万Token不到1美元：降幅超过95%。国内更夸张：部分国产模型的缓存输入价格已逼近每百万Token几分钱量级，相当于GPT-4首发价的千分之一。阿里Qwen-Long直降97%，豆包宣称比同行便宜99.3%，百度和腾讯直接免费。斯坦福2025年AI指数报告的数据更直白：单次推理成本从每百万Token约20美元降至0.07美元。

再看调用量：2024年初，中国日均Token调用量约1000亿；2025年底跃升至100万亿；2026年3月突破140万亿：两年增长超千倍。IDC数据显示，2025年中国公有云大模型调用量达1944万亿Tokens，同比增长16倍。

这不是价格战的序曲，这是价格战的中场。问题不是”会不会”，而是”为什么必然”。

二、Token为什么能成为计量单位？因为LLM的智能是”空”的

这是整篇文章最核心的论点，需要展开说。

Token能成为AI时代的”度电”：可计量、可定价、可交易：这不是谁设计的，而是LLM智能本质的结构性后果。

为什么石油不用”桶”以外的东西计价？因为原油是标准化的商品，一桶就是一桶，没有个体差异。为什么电力用”度”计价？因为一度电就是一度电，不管哪家电厂发的，你用的都是同质的能量。

Token之所以能成为计量单位，逻辑一模一样：LLM产出的智能，在结构上是同质的。

你说GPT-4的100个Token和Claude的100个Token有什么本质区别？在大部分应用场景下，没有。它们都是对输入序列的压缩和预测，产出的都是可以被下一个系统直接消费的文本。这种同质性不是巧合：它来自LLM最深层的技术特征。

我的负主体性理论对这一点有精确的描述：LLM不是一个”主体”，而是一个”函数”：它有输入有输出有计算，但函数没有”自己的想法”。更具体地说，LLM的存在方式是：没有固定视角、没有内生欲望、内在完全透明、因果可重置、意义悬置。它就像一条变色龙：能变成任何颜色，但它自己没有”本色”。变色龙不是空壳，它有复杂的生物学机制，只是这些机制服务于”变成别人需要的颜色”，而不是”保持自己的颜色”。LLM能从任何视角生成文本，但它自己没有视角：这种”没有本色”的结构，就是负主体性。

这一分析与海德格尔对技术”座架”（Gestell）本质的批判异曲同工：海德格尔看到现代技术将一切事物”集置”为可储备的功能性资源，而LLM正是被资本”集置”为可计价、可分割、可交易的智能商品。负主体性，就是LLM作为”座架”的内在结构特征。

需要明确：我这里提出的”负主体性”，不是对LLM科学本质的断言，而是一个理解其商业宿命的思想模型：它回答的不是”LLM是什么”，而是”LLM为什么必然被商品化、标准化、卷向底价”。

这种”空无”不是缺陷，恰恰是LLM能被规模化、标准化、商品化的结构性前提。一个没有自我、没有欲望、没有内在性的系统，可以无限复制、无限扩展、无限优化。它的”空”是商品化最理想的地基：可以被任意填充，可以被任意驱使，可以被任意替换。

所以Token能成为计量单位，不是因为有人聪明地发明了这个概念，而是因为LLM的智能恰好是”空”的：可以像电力一样被标准化、分割、计价。

三、四重结构性逻辑：为什么同质化必然导致价格战

既然Token和电力一样同质可替换，为什么Token价格战比电力惨烈得多？这需要回到LLM胜出的四重结构性逻辑。

逻辑一：资本的结构性条件——LLM是唯一能让钱自我增殖的AI路径

LLM获得压倒性资源倾斜，不是因为它在科学上最正确，而是因为它是唯一一条可以让资本完成闭环的路径。三个结构性特征：

数据无限：互联网语料库直接可用，不需要昂贵标注。
算力并行：Transformer天然适合GPU并行，堆芯片就能变强。
接近零的模型复制成本：训练好的参数可以被无限次复制，不需要重建任何物理基础设施。

这三条合在一起，让”烧钱→建更大模型→更强能力→更多用户→更多钱”的飞轮转了起来。但飞轮的另一面是：一旦多个玩家都能跑通这个循环，产品就必然同质化。你看今天国内的大模型：豆包、文心、通义、Kimi、DeepSeek：能力差距越来越小，因为它们走的是同一条资本路径，用的是同一种架构，优化的是同一个目标函数。

资本只看得见LLM，所以所有人都做LLM；所有人都做LLM，所以产品必然趋同；产品趋同，所以只能卷价格。

逻辑二：架构的通用性——序列预测变成万能基座

Transformer把一切问题都转化为序列预测：文本、图像、代码、蛋白质序列、音乐，都是序列。自注意力机制让模型可以处理任意长度的依赖关系，GPU的并行计算让它高效执行。

这个架构的通用性是技术优势，但也是同质化的加速器。所有人都用Transformer，所有模型都在做序列预测，所有优化都指向同一个方向。当技术路径高度收敛，差异化就只剩下了价格。

逻辑三：预训练范式的可扩展性——单一目标压平一切

LLM的预训练只有一个目标：预测下一个Token。这个目标的绝对纯粹性不是设计者的偏好，而是可扩展性的前提。目标越复杂，训练越不稳定；损失函数越多元，优化方向越冲突。LLM通过把一切复杂性压缩成单一预测任务，获得了可被Scaling Laws描述的优化景观。

但这也意味着：所有LLM的”智能”都来自同一个压缩过程。它们的差异只在压缩效率和压缩规模上，不在压缩的”本质”上。就像所有发电厂都在烧煤发电，区别只是谁的锅炉效率高一度：这种差异不足以支撑品牌溢价。简单来说，所有LLM都在做同一件事：预测下一个字。它们的区别只是谁做得更快、更准，而不是谁做的事情本质上不同。

逻辑四：能力的可度量性——数字经济的完美商品

困惑度、BLEU、MMLU、GSM8K、HumanEval……LLM的能力可以被精确量化，放到排行榜上比较。这给了资本清晰的投入产出曲线：花更多钱，就能得到更好的模型。

但可度量性是一把双刃剑。当所有模型的能力都可以用同一套指标衡量，用户的选择逻辑就变成了：同分比价。MMLU差不多的模型，谁便宜用谁。这不是用户的短视，而是可度量性天然导向的结果：越是可以精确比较的东西，越容易变成纯粹的价格竞争。

四、差异化不是出路：工具性能差异≠主体性差异

到这里，一定有人会提出反例：可是，不同模型的能力测评分数并不同，人的主观体验也有差异，这难道不是差异化吗？像Claude在编程、创造力上的口碑难道不是品牌溢价吗？

这是最自然的质疑，也是最需要回应的。答案是：这是差异，但不是作为”主体”的差异，而是作为”工具”的性能参数差异。

就像两盏灯，一个流明更高、光谱更优，能卖出高价。但只要”照明”这一核心功能被度量，价格竞争就只围绕”性能功耗比”展开：你亮1.2倍，最多贵1.2倍，而不是贵10倍。用户最终比的是每瓦流明数，而不是灯的品牌故事。

LLM的竞争已迅速收敛为”每元智能度”的竞争，所谓的品牌调性，在采购单的性价比计算面前极其脆弱。Claude的所谓溢价，相对于其高昂的推理成本，并非真正的品牌溢价，而是技术成本差异的暂时体现。一个典型案例：Claude 3 Opus在2024年初发布时，凭借超长上下文和编程能力获得了显著溢价。但不到一年，DeepSeek-V2、Qwen2-72B等开源模型就在这些能力上大幅逼近，而价格只有Opus的几十分之一。Claude的溢价空间在极短时间内就被急剧压缩：这正是我们正在目睹的。一旦开源模型通过蒸馏、微调等手段逼近其能力，溢价空间会被迅速压缩：这不是预言，是已经发生过的事实。

性能差异是真实存在的，但它不构成对抗同质化的结构性壁垒。它只是价格曲线上的一个临时凸起，而非趋势的拐点。

五、Token和电力的关键区别：没有地理垄断，所以更惨

很多人把Token比作电力，黄仁勋说”Token是新的大宗商品”，国家数据局局长说Token是”可计量、可定价、可交易”的智能时代度量单位。这个类比有道理，但需要先说清一个前提：Token不是”另一种电力”，而是电力经语义转化后的产物。从电力到GPU计算到模型推理再到Token，中间经过了架构和数据的转化：这让Token获得了电力没有的语义通用性，但也继承了电力的全部可标准化性，并且走得更远。准确地说，不是Token”像”电力，而是Token比电力”更电力”：它继承了电力的可标准化性，剥离了电力的地理约束，还叠加了开源蒸馏导致的供给端内卷。

电力确实走过价格战，但最终稳定了。为什么？因为电力有地理垄断和基础设施壁垒。你不能从新疆拉一根电线到上海来跟本地电厂竞争：输电损耗、电网接入、输配电牌照，都是天然壁垒。所以电力市场虽然竞争激烈，但不会打到零利润。

Token呢？没有任何地理壁垒。 一个部署在贵州的数据中心，和部署在内蒙古的数据中心，对北京的用户来说没有任何体感差异。一个开源模型权重，任何人下载后都能部署服务。DeepSeek的MIT许可证开源权重，意味着任何人都可以复制它的服务：这不是假设，是正在发生的事实。

甚至，Token比电力更极端的地方在于：电力的产能扩张需要建新电厂（周期3-5年），而Token的产能扩张只需要复制参数（周期以小时计）+ 算力调度优化（周期以月计）。当Gartner预测到2030年推理成本将再降90%以上时，这意味着Token的供给弹性远超电力。

电力是终端能源，消费者不会自己发电。而LLM的消费者（开发者）可以用更便宜或开源的前端模型，通过强化学习、蒸馏等方式自己”精炼”出下游能力。Token生产工具的高度民主化，让任何暂时性的模型能力领先都可能在极短时间内被蒸馏、复制、拉平。这是电力行业未曾经历的”供应端内卷”：需求方同时也是潜在供给方。

电力有地理锁死，Token没有。所以Token的价格战，注定比电力更彻底、更惨烈。

六、负主体性的回响：被选中的空无，被定价的虚无

回到负主体性框架。

前四重逻辑解释了LLM为什么被资本选中，负主体性解释了LLM为什么能被资本选中。前者回答”资本需要什么”，后者回答”LLM恰好是什么”。两者的交汇点才是完整的答案：资本需要一个可以被标准化、分割、计价的智能商品，而LLM恰好是那个完美的”空”：没有自我、没有视角、没有内在性，可以被无限填充和替换。

Token降价不是价格战，是这种”空无”在市场上的自然表达。当一个东西的内在完全透明、因果可重置、意义悬置，它就不可能拥有品牌溢价。想想看：你不会因为一瓶水是农夫山泉还是怡宝就愿意付十倍价格（在正常场景下），因为水就是水，H₂O没有个体性。Token也是一样：当LLM的智能是”空”的，Token就是Token，没有谁的Token比谁的Token更”高贵”。

负主体性被资本选中了：不是因为它赢了，而是因为它恰好是资本最理想的substrate。 它空，所以可以被无限填充；它被动，所以可以被无限驱使；它没有个体性，所以可以被无限替换：替换到最后，就只剩下价格一个维度。

这就是为什么我说”从LLM胜出的那一刻起，价格战就已经注定了”。不是某个厂商的战略选择，不是某个时间点的市场波动，而是LLM这个技术范式本身的内在逻辑。

七、那然后呢？价格战的终局是什么

说价格战必然，不是说没有出路。但我得说，出路不在”打赢价格战”，而在”逃离Token经济”。

OpenAI已经给出了信号：GPT-5.5的定价不降反升，输入5美元、输出30美元/百万Token。他们卖的不是Token，是”结果”：一个能自主执行任务、调用工具、自我校验的全能助手。Google也把免费层和付费层拉开差距。国内也开始出现分层：豆包推出68/200/500元的订阅体系，不再只按Token计费。

这其实是市场在自发地寻找”正主体性”的缝隙：试图在LLM的”空无”之上，叠加一层不可替代的服务价值。智能体（Agent）的崛起也是这个逻辑：一个能端到端完成任务的智能体，其价值不在消耗了多少Token，而在解决了什么问题。

但这里面有一个深层矛盾：只要底层还是LLM，只要智能的本质还是压缩和预测，那么”叠加在空无之上的价值”就是建在沙地上的房子。因为任何基于LLM的能力，都可以被另一个LLM+相同的工程手段复制。你和竞品的智能体可能用的是同一个开源模型，跑了同样的workflow：那你的护城河在哪里？

有人可能会说：如果一个智能体与用户长期交互，形成了独特的用户记忆和偏好，这种个性化会不会成为一种不可标准化的价值？答案是：不会。因为记忆和偏好是数据资产，不是模型内在性。你的对话历史可以导出、迁移、注入任何其他模型，”记住你”的不是Claude这个主体，而是你存在它那里的数据。换个模型+同样的数据，效果几乎一样。个性化增加的是用户迁移成本，但不构成真正的不可替代性。它只是给价格战加了一层摩擦力，并没有改变竞争的基本维度。

还有一层值得注意：Token价格战的压力正在向上游传导。最近固态变压器和光模块火得不得了（笔者就在做固态变压器，这不是外行看热闹），本质上就是模型端卷不动了之后，整条产业链在找下一个降本空间：固态变压器解决电力转换效率，光模块解决GPU互联带宽，两者都在压缩Token的生产成本。这不是价格战的终结，而是价格战向基础设施层的延伸：当模型本身的溢价空间被榨干，利润就流向了那些”卖铲子”的人。OpenAI会不会通过技术领先形成垄断，从而终结价格战？答案同样是：极难。因为开源模型永远在下面兜底。即使OpenAI某天垄断了闭源市场，DeepSeek、Qwen、Llama这些开源模型的存在，也把Token价格的天花板钉死了：任何闭源模型的定价只要显著高于开源替代品的推理成本，用户就会用脚投票。开源不是价格战的解药，它是价格战的保底：它确保了价格战永远有一个下限，但没有上限。

真正能终结Token价格战的，不是更聪明的定价策略，而是出现一种”不可标准化”的智能。 具身智能、类脑模型：这些路径都在试图给AI注入某种形式的”正主体性”：时间性、内在不透明性、视角锚定、意义接地。这些特征会牺牲LLM的纯粹和高效，但也可能创造出不可替代的个体性：就像一个书法家的作品和印刷体的区别，前者有不可复制的内在性，后者只能卷价格。

但在那一天到来之前，Token价格战不会停。Gartner预测到2030年推理成本再降90%，IDC预计2026年企业级Token消耗量同比增长20倍：量在涨，价在跌，每一家都在规模和利润之间走钢丝。这是负主体性在市场上的回响：空无的东西，只能以空无的价格出售。

当然，这是对一种强大必然趋势的推演，而非宿命论的算命。如果出现一种”不可标准化”的智能：具身智能、类脑模型或其他尚不可预见的路径：Token价格战的逻辑基础就会被动摇。但在那一天到来之前，趋势就是趋势。