← 返回主页

系列导航

责任梯度：当我们终于能量化”代价”，下一步怎么办？

【负主体性系列·第22篇责任梯度】

一、从”能追责吗”到”该找谁”

上一篇文章我们聊了 CCI（综合代价指数），一个用来量化”生存性代价”的框架。简单说，当一个决策的后果不可逆、时间压力大、影响人数多、价值冲突强——这个决策的 CCI 就高，意味着它”很重”，重到谁都不敢随便做主。

但问题来了：CCI 告诉我们的只是”这个决定很重”。它没有告诉我们：这么重的决定，到底该由谁来负责？

这才是真正让人头疼的问题。

你可能觉得，这有什么好头疼的？谁做的决定，谁负责呗。但问题是，在现代 AI 系统里，”谁做的决定”早就不是一个清晰的事实了。

比如，Uber 的自动驾驶汽车撞死了人。技术上，车是 AI 在开；但 Uber 禁用了自动紧急制动；安全员当时在看手机；传感器明明看到了行人却把她归类为”未知物体”。这么多环节凑在一起，造成了悲剧。你说该找谁？

传统的法律框架会说：找安全员，他是最后应该接管的人。但这个回答越来越不够用了。因为越来越多的场景里，AI 不是在”辅助”人类做决定，而是在”代替”人类做决定——或者说，在人类根本没来得及反应的时候，它已经替你做了决定。

这时候，我们需要的不是一个”谁来背锅”的简单答案，而是一套结构化的思考框架——告诉你在什么情况下，责任应该集中在哪里，在什么情况下，可以适当分散。

这就是”责任梯度”要解决的问题。

二、两条走不通的老路

在进入责任梯度之前，我们先看看现有的两条思路为什么不够用。

第一条路，我管它叫”弥合派”。

弥合派的核心想法是：责任鸿沟不是问题，是我们的责任概念太落后了。传统责任理论建立在”人有意图、人有自由意志”的基础上，但 AI 既有意图的成分，又有自主性，凭什么非要把责任安在人类头上？不如重新定义责任，搞一个”分布式责任”，人类、AI、开发者、设计者大家一起扛。

听起来很现代对吧？但这套方案有一个致命的软肋：它给不出可操作的标准。

“大家一起扛”听起来公平，但实践中很容易变成”大家都不扛”。当受害者想要讨个说法的时候，弥合派的回答是：责任分散在系统里，你自己去找吧。结果往往是受害者在复杂的责任链条里耗尽精力，而真正的责任方躲在”集体负责”背后全身而退。

需要说明的是：这里是对弥合派核心困境的简化概括。实际上，不同的分布式责任理论提出了不同的分配机制——如Noh (2025)的”非人类中心主义责任”模型、Constantinescu和Kaptein (2025)的”M3方法”——但它们共同面临的挑战是：在缺乏可操作锚点的情况下，分布式责任很容易在实践中沦为”无人责任”。

第二条路，是”证明派”。

证明派的思路正好相反：别挣扎了，数学已经证明了——在某些条件下，任何责任框架都会失效。

学者 Tibebu (2026)提出了一个”问责地平线”定理：当人机集体复合自主性（即人类和AI共同构成的决策系统的整体自主程度）超过临界点、且系统存在反馈循环的情况下，不存在任何框架能同时满足”可归因性”、”可预见性”和”可干预性”这三个基本要求。这里的”反馈循环”指的是 AI 系统根据用户行为调整策略，而用户又受策略影响改变行为，形成闭环——在这种高度动态、互相嵌套的系统中，传统的责任追溯机制会面临根本性困难。

这个证明很优雅，也很重要。但它的问题在于：证明”不可能”之后呢？

证明派的学者满足于揭示极限，但当他们放下粉笔走出教室，现实世界的法庭、监管机构、政策制定者依然需要做决定。在”问责地平线”之下的可治理空间里，我们仍然需要一个分配责任的操作方案。

三、第三条路：承认鸿沟，务实分配

责任梯度模型走的是一条中间道路。

它承认：责任鸿沟在本体论（关于”什么东西存在、什么东西是什么”的哲学追问）层面确实不可弥合。AI 不是人，它不承担生存性代价，它不会被监禁、不用承受良心的谴责、不会因为一次错误决定而改变自己的人生轨迹。只要 AI 不具备这些特征，它就无法成为一个真正意义上的道德主体。

但它同时主张：在”问责地平线”之下的可治理空间内，我们不应该放弃结构化的思考。梯度，就是这个结构化方案的核心。

梯度，而不是悬崖。

我们的大脑天然喜欢二元对立：要么人类负责，要么 AI 无责。要么安全，要么危险。但真实世界里，人机协作是一个连续谱系——从完全由人类掌控的决策，到完全由 AI 自主完成的操作，中间有巨大的灰色地带。

梯度思维的关键转变在于：责任不是”有”或”无”的二元选择，而是随着决策的”重量”（即生存性代价）变化而连续调整的量。

用一个不太精确但好理解的比方：如果你只是推荐一首歌，责任很小；如果你在推荐一处房产，风险陡增；如果你在决定要不要给病人上呼吸机，责任就大到必须由人类来做最终决定——这个责任的递增过程，就是梯度。

四、CCI 6.0：一条新增的分界线

在展开责任梯度的具体分层之前，我需要解释一下为什么我们要在 CCI = 6.0 这个位置新增一条分界线。

在之前的 CCI 框架里，治理层级是三层的：高（CCI ≥ 6.0）、中（3.0 ≤ CCI < 6.0）、低（CCI < 3.0）。这个划分对”量化代价”是够用的。

但当我们的目标从”评估代价”转向”分配责任”时，三层结构就显得粗糙了。自动驾驶里的”辅助驾驶”和”高度自动驾驶”，医疗 AI 里的”生成诊断建议”和”辅助制定治疗方案”——这些场景的 CCI 可能都在 4.0 到 7.0 之间，但它们对人类介入程度的要求其实是不同的。

于是我们把中间层一分为二：

强委托区间（6.0 ≤ CCI < 8.0）：AI 生成建议，人类必须实质性审查和批准。典型的例子是大额贷款审批，审批官不能只点”同意”，他必须独立核实 AI 的建议。
弱委托区间（4.0 ≤ CCI < 6.0）：AI 执行操作，人类以监控者角色保持较低程度的参与。典型的例子是辅助驾驶中的自适应巡航，人类只需要在异常时介入。

一个重要的说明：为什么从”中（3.0 ≤ CCI < 6.0）”变成了”弱委托（4.0 ≤ CCI < 6.0）”？这不是笔误，而是有理论依据的调整。在”量化代价”的语境中，3.0作为下限是合理的；但在”分配责任”的语境中，我们需要为”安全委托”（CCI < 4.0）留出空间——当 CCI 低于 4.0 时，决策的生存性代价已经降到足够低的水平，人类可以仅承担事后审计的角色。这个 4.0 分界线的依据是：当五个维度中大多数评分在 1-2 分区间时，决策几乎不涉及生存性代价。注意：这个 4.0 的下限和上一篇 CCI 文章是一致的——当时我们把”推荐系统”的 CCI 评为 1.4，远远低于 4.0。所以这个下限不是随意调整的，它基于已验证的基准案例。

CCI = 6.0 这条线的理论依据是：当”后果不可逆程度”和”时间约束压力”同时处于中高水平时，决策的生存性代价开始显著跃升，需要更强的人类介入机制来兜底。

一个方法论说明：在计算 CCI 时，我们采用等权重方案（五个维度各占 0.2）。这不是因为我们确信五个维度同等重要，而是基于”认识论谦逊”——目前还没有足够的经验证据来确定哪个维度更重要。等权重是一种谨慎的方法论选择，它让框架更容易被审计和讨论。

五、四层责任梯度

好了，现在我们可以来看看责任梯度的全貌了。

方法论说明：以下责任比例（70%/30%、40%/60%、20%/80%）是伦理框架层面的参考基准，用于指导制度设计和政策讨论，而非法律上的过错认定或赔偿分配比例。具体情境中的比例可能因案件情节而有所调整。这些数字反映的是在特定 CCI 区间内，人类与开发者在责任分配中的一般性原则——它们提供的是方向性指引，而非精确公式。

第一层：强制人类保留（CCI ≥ 8.0）

人类角色：决策者，100% 控制权。AI 角色：信息提供者。责任归属：人类 100%。

这是责任最重的层级。涉及生命存亡、根本权利的决策，必须由人类来做，AI 只能提供信息参考。

典型的例子：临终关怀决策、死刑量刑、核打击指令。

需要诚实说明的是：这一层也包含一些”框架的边界案例”。比如自动驾驶汽车面临不可避免的碰撞时，必须在两个可能的伤害对象之间做出选择——这种情况的 CCI 极高，理论上应当适用完全人类责任模式，但在极短的时间窗口内（比如几毫秒），人类在物理上根本来不及接管。这种情况下，”人类应当保留控制权”的原则本身就面临根本性挑战。这不是框架的失败，而是框架诚实地标注了它的适用边界。

第二层：有条件委托——强（6.0 ≤ CCI < 8.0）

人类角色：批准者。AI 角色：建议生成者。责任归属：人类 70%，开发者 30%。

这一层的核心特征是：AI 生成的建议具有实质性的影响力，但人类批准者必须进行实质性审查，而不是走过场。

典型案例包括：医疗诊断的最终确认、大额贷款审批。

举个例子。一套 AI 辅助诊断系统对某位病人的影像做出了”高度疑似恶性肿瘤”的判断。系统把这个结果呈现给了主治医生。在强委托模式下，医生不能简单地点”确认”——他需要查看原始影像、独立评估系统给出的依据、考虑病人的整体情况，然后做出自己的判断。如果最后还是决定做手术，责任比例是：人类 70%，开发者 30%。

这里的 70% 不是随意设定的——它反映的是：在这一层级，人类的审查义务是”实质性的”，如果审查失职，就要承担主要责任。同时，这也是基于”规范性依据”（凭什么应该这样做的理由）：在高生存性代价情境中，人类是唯一能够承担不可逆后果的主体，因此应当承担主要责任。

开发者责任的法律性质：这一层级中，开发者承担的 30% 属于间接责任。具体包括：（1）产品责任——AI 系统作为产品，其提供者对系统缺陷造成的损害承担责任（如 AI 辅助诊断系统给出错误诊断导致延误治疗）；（2）设计缺陷责任——当 AI 系统的设计存在固有缺陷导致损害时，开发者应承担责任（如训练数据偏差导致贷款歧视）；（3）服务责任——当 AI 作为服务提供的一部分时，服务提供者对服务质量负有注意义务（如 AI 法律咨询给出误导性建议）。

第三层：有条件委托——弱（4.0 ≤ CCI < 6.0）

人类角色：监控者。AI 角色：执行者。责任归属：人类 40%，开发者 60%。

与强委托不同，弱委托的核心是：AI 基本上在自主运作，人类以监控者身份”在场”，但不需要对每一步都进行实质性审查。

典型案例：自动驾驶中的中速巡航、电商推荐系统。

想象你在高速上开着车，启动了自适应巡航和车道保持功能。车自己在开，但你坐在驾驶座上，双手虚搭方向盘，眼睛盯着路面。这是一种典型的弱委托场景：AI 负责执行”保持车距”和”车道居中”，你负责监控异常情况——比如前车突然减速，或者有车从盲区插进来。

第四层：安全委托（CCI < 4.0）

人类角色：审计者（事后审查）。AI 角色：完全自主决策者。责任归属：人类 20%，开发者 80%。

当决策的生存性代价降到足够低时，人类可以退居幕后，只在事后进行审计。

典型案例：个性化音乐推荐、高频交易算法、内容自动审核。

这个层级的关键是”事后问责”而非”事中审批”。AI 系统可以自主运行，但如果出了问题，通过事后审计追溯责任。

CCI = 2.0 的细分线：当 CCI 进一步降到 2.0 以下时（比如自动排版、邮件分类），责任的绝大部分已经转移到开发者/部署者身上，人类只承担最小程度的监督义务，开发者承担接近 100% 的责任。选择 2.0 作为分界线的依据是：当 CCI 低于 2.0 时，五个维度中大多数评分在 1-2 分区间，意味着决策几乎不涉及生存性代价——后果高度可逆、时间窗口充裕、影响范围有限。

以上就是责任梯度的全貌。听起来可能有点抽象——没关系，接下来我们用一个真实案例来检验一下。

六、用真实案例检验：Uber 事故的责任图谱

说了这么多抽象的框架，让我们用真实的案例来检验一下。

2018 年 3 月，Uber 的自动驾驶汽车在亚利桑那州撞死了一位推着自行车过马路的行人 Elaine Herzberg。

根据 NTSB（美国国家运输安全委员会）的调查，事故发生前几秒，传感器已经检测到了 Herzberg，但把她分类成了”未知物体”，没有识别为行人。系统判断需要紧急制动，但 Uber 把自动紧急制动功能禁用了——理由是避免”不稳定的驾驶体验”。事故前 1.3 秒，系统才做出反应，但为时已晚。车上的安全驾驶员 Rafaela Vasquez 在事故发生前正低头看手机。

现在，用 CCI 来评估这个决策情境：

维度	评分	说明
后果不可逆程度	10	生命丧失，完全不可逆
时间约束压力	8	系统需要在极短时间内做出反应
受影响者范围	6	涉及受害者及其家庭，对公众安全信心有广泛影响
价值冲突强度	7	涉及行人安全与交通效率的权衡
认知负荷预估	7	安全驾驶员需在复杂光照条件下保持警觉

CCI = 0.2 × (10+8+6+7+7) = 7.6

7.6 落在第二层（强委托区间）。这意味着：人类主责模式，人类 70%，开发者 30%。

具体来说：

Uber 作为开发者/部署端（30%） 承担以下责任：

产品责任——Uber 作为 AI 系统的提供者和部署者，对系统整体性能负有注意义务；
设计缺陷责任——明知禁用自动紧急制动会增加风险，还是做了这个决定；行人识别能力未达到安全部署标准；
监督责任——对安全驾驶员的安排和培训不到位。

安全驾驶员 Rafaela Vasquez（人类端的直接责任方） 承担监控失职的直接责任——在自动驾驶模式下没有保持应有的警觉。需要指出的是，NTSB调查发现Uber系统被设计为在撞击前不到一秒才发出警报，安全驾驶员在此之前几乎没有收到任何预警——系统设计本身就在制造”监控难以有效”的条件，这进一步强化了开发者端应承担实质责任。

有意思的是，2019 年亚利桑那州的检察官宣布不会对 Uber 提起刑事指控。但这并不是故事的结尾——2020 年，安全驾驶员 Vasquez 被亚利桑那州大陪审团指控过失杀人罪。这恰恰说明：在现行法律框架下，人类的直接过失行为仍然是可以被追责的；问题在于，开发者的设计决策——比如禁用自动紧急制动——在法律上还没有被充分纳入考量。这也印证了”责任梯度”框架的必要性：在高 CCI 情境中，既要追究人类端的直接责任，也要追溯开发者端的设计决策责任。

七、为什么不选”能动性”？

到这里，可能有读者会问：为什么不用”能动性”（agency）来作为决定责任分配的变量？这也是一条思路——AI 的自主性越强，人类承担的责任就越少。

这个思路有一定道理，但有一个根本性的问题：能动性可以告诉我们”谁参与了这件事”，但不能回答”谁该为这件事承担主要责任”。

需要先承认一点：能动性确实是责任归属的必要条件。

“谁做了这件事”是追问责任的首要前提。一个完全无法行动的主体，确实无法承担任何责任。

但能动性只是必要条件，不是充分条件。它回答的问题是”主体能不能行动”，而我们真正需要回答的问题是”主体凭什么要承担后果”。

这就要说到生存性代价了。生存性代价是一个本体论概念，它回答的是：主体能不能承担行动的后果？

Uber 案例里的安全员为什么有责任？一种常见的论证是：他是”最后一个能踩刹车的人”。但这种论证容易被反驳——如果安全员当时在看手机、根本没看路，你怎么说他”能”踩刹车呢？他甚至”没有行动”！

然而，这个反驳本身是有问题的。安全员看手机恰恰是一种”不作为”（omission）——在法律和伦理上，选择不监控同样是能动性的一种表现。更重要的是，即使我们承认安全员当时”没有行动”，能动性本身仍然不能告诉我们：他应该承担多大比例的责任。

这才是关键。能动性回答的是”他能不能做”，但不能回答”他该为后果承担多少”。要回答后者，我们需要引入生存性代价的维度：正是因为人类承担着生存性代价——他是血肉之躯，他有家庭，他有必死性，他无法回滚自己的人生——他才应该成为高风险决策的主要责任承担者。

能动性梯度模型（Xia, 2025）是一个重要的理论贡献，但它的决定变量——能否行动——只回答了责任归属的前提条件，没有回答责任分配的规范性依据。责任梯度的核心命题是：责任的核心不是”谁做了这件事”，而是”谁为这件事付出代价”。

顺便说明一下：系列标题中的”负主体性”是本文作者提出的概念，指的是 AI 作为一种”不具备承担生存性代价能力”的行动者，其主体性是一种”缺失”或”否定”意义上的主体性——它能行动，但不能承担。这与生存性代价的概念是一脉相承的。

八、三篇论文串起来的线索

写到这里，我想稍微停下来，帮读者梳理一下这三篇文章之间的逻辑关系。

第一篇《代价的肉身》解决的是”什么是生存性代价”——从热力学的不可逆性、必死性的嵌入、存在性纽带三个层面，建立了这个概念的本体论基础。

第二篇《CCI 框架》解决的是”生存性代价怎么量化”——把抽象的生存性代价拆解成五个可评估的维度，提出了 CCI 的计算公式。

第三篇《责任梯度》解决的是”量化之后怎么分配”——基于 CCI 的阈值划分，构建了四层责任梯度，明确了在每种情境下人类、开发者和部署者各自的责任比例。

如果用一个比喻：第一篇画了一张地图，告诉你”这里有一片责任荒野”；第二篇给荒野装上了测量仪器；第三篇则标注了这片荒野的通行规则——谁走哪段、谁负哪段的责任。

九、儒家差序格局的一点启发

最后，我想从一个跨文化的角度，聊一个可能让你觉得有点意外的话题：儒家传统里的”差序格局”。

费孝通先生提出这个概念，用来描述中国传统社会的结构——以自我为中心，一圈一圈地向外推，亲疏远近决定关系的厚薄。近的关系近管，远的远管，超出范围的，可以不管。

这个概念和责任梯度有结构上的相似性：都是从中心到边缘的递减关系。但我必须强调：相似性不等于等同。

差序格局的核心变量是关系距离——谁和我亲，谁和我疏。而责任梯度的核心变量是决策的生存性代价——这个决定有多重。两者回答的不是同一个问题。

但差序格局的思路可以给我们一点启发：责任分配从来不是一个文化中立的技术问题。不同的社会对于”谁该管谁”有不同的预设，对于”亲疏远近”的感知也不同。

比如，在东亚的医疗场景中，家庭在重大医疗决策中的参与度通常高于西方。CCI 框架里的”受影响者范围”维度会捕捉到这一点——因为家庭成员的参与确实扩大了决策的”影响圈”，进而推高了 CCI 值。但这只是一个量化参数，它并不预设哪种模式”更好”。

跨文化比较的价值在于：它提醒我们，责任分配方案不是铁板一块的——同样的技术场景，在不同的社会文化土壤里，可能需要不同的参数校准。但需要强调的是：框架的结构——即基于生存性代价进行梯度分配——是跨文化的；变化的是具体维度的评分权重，而不是框架本身的逻辑。

十、结语：框架不是终点

责任梯度模型提供了一套结构化的思考工具，但它不是终点。

它承认了自己的适用边界：当 CCI 逼近”问责地平线”时，框架的指引力会减弱。它也承认了自己的主观性：五个维度的评分依赖评估者的判断，任何风险评估工具都面临这个问题——但主观性不等于随意性，结构化的主观判断比随意的直觉更可审计、更可追问。

更重要的是，这套框架是为”可治理空间”设计的。它不声称解决了所有问题，但它希望在现有法律框架来不及更新的空隙里，提供一些可以参考的方向。

当技术跑在法律前面的时候，我们需要的不只是等待立法，还需要思考。当一个人被算法量刑、当一辆车被 AI 驾驶、当一个人的生死被某个 AI 系统”建议”了治疗方案——我们至少需要知道，这个系统在哪里、谁该为它的后果负责、人类的角色应该退到哪里、进到哪里。

毕竟，责任不是”有”或”无”的二元选择，而是随着决策的重量变化而调整的量——责任梯度，就是这个思考的起点。

作者：龍德明宇

系列文章：负主体性之责任鸿沟系列

“负主体性”：指AI作为一种”能行动但不能承担”的存在者，其主体性是一种缺失意义上的主体性。

【学术声明】

本站学术工作按理论层级组织如下：

基础理论

Compression Is Intelligence: The Common Ground of Positive Subjectivity and Negative Subjectivity (PhilArchive, 2026)

Compression Strategy Spectrum: A Quantitative Framework for Ontological Positions (PhilArchive, 2026)

核心理论

Negative Subjectivity: The Ontological Inversion of Large Language Models (PhilArchive, 2026)

负主体系列 DOI:10.5281/zenodo.19785390

《负主体性：大模型成长之路的存在论倒置》（中文专著，约13万字，已完稿，待发表）

《从负主体性到灰体性：AI存在论的量化转向》（中文专著，约13万字，已完稿，待发表）

展开方向

From Emptiness to Scaffolding: The Real Contribution of Harness Engineering (PhilArchive, 2026)

Silicon-Based Developing Writing: A New Philosophical Writing Paradigm in the Age of Large Language Models (PhilArchive, 2026)

《硅基显影：一种自我认识的方法论》（中文专著，已完稿，待发表）

The Flesh of Cost: Why Artificial Intelligence Cannot Bridge the “Responsibility Gap” (Revised and Expanded Edition) (PhilArchive, 2026)

Quantifying Existential Cost: The CCI Framework for AI Governance Decisions (PhilArchive, 2026)

Responsibility Gradient: From CCI to Structured Responsibility Allocation (PhilArchive, 2026)

Why Capital Chooses LLMs: Negative Subjectivity as the Ontological Foundation of LLM Hegemony (PhilArchive, 2026)

《代价的肉身——为什么人工智能无法跨越”责任鸿沟”》（哲学社会科学预印本平台, 2026）DOI: 10.12451/202605.00073

World Models: When AI Moves from “Seeing” to “Doing” — A Causal Inquiry from the Perspective of Negative Subjectivity (PhilArchive, 2026)

以上学术成果均由作者龍德明宇完成。各篇在其所属层级内做出独立贡献，基础理论为下游展开提供统一根基，但不替代各方向的独立论证。