系列导航 导读 第1篇 第2篇 第3篇 第4篇 第5篇 第6篇 第7篇 第8篇 第9篇 第10篇 第11篇
第12篇 第13篇 第14篇 第15篇 第16篇 第17篇 第18篇 第19篇 第20篇 第21篇 第22篇 案例系列 ↗

责任梯度:当我们终于能量化”代价”,下一步怎么办?

【负主体性系列·第22篇责任梯度】


一、从”能追责吗”到”该找谁”

上一篇文章我们聊了 CCI(综合代价指数),一个用来量化”生存性代价”的框架。简单说,当一个决策的后果不可逆、时间压力大、影响人数多、价值冲突强——这个决策的 CCI 就高,意味着它”很重”,重到谁都不敢随便做主。

但问题来了:CCI 告诉我们的只是”这个决定很重”。它没有告诉我们:这么重的决定,到底该由谁来负责?

这才是真正让人头疼的问题。

你可能觉得,这有什么好头疼的?谁做的决定,谁负责呗。但问题是,在现代 AI 系统里,”谁做的决定”早就不是一个清晰的事实了。

比如,Uber 的自动驾驶汽车撞死了人。技术上,车是 AI 在开;但 Uber 禁用了自动紧急制动;安全员当时在看手机;传感器明明看到了行人却把她归类为”未知物体”。这么多环节凑在一起,造成了悲剧。你说该找谁?

传统的法律框架会说:找安全员,他是最后应该接管的人。但这个回答越来越不够用了。因为越来越多的场景里,AI 不是在”辅助”人类做决定,而是在”代替”人类做决定——或者说,在人类根本没来得及反应的时候,它已经替你做了决定。

这时候,我们需要的不是一个”谁来背锅”的简单答案,而是一套结构化的思考框架——告诉你在什么情况下,责任应该集中在哪里,在什么情况下,可以适当分散。

这就是”责任梯度”要解决的问题。


二、两条走不通的老路

在进入责任梯度之前,我们先看看现有的两条思路为什么不够用。

第一条路,我管它叫”弥合派”。

弥合派的核心想法是:责任鸿沟不是问题,是我们的责任概念太落后了。传统责任理论建立在”人有意图、人有自由意志”的基础上,但 AI 既有意图的成分,又有自主性,凭什么非要把责任安在人类头上?不如重新定义责任,搞一个”分布式责任”,人类、AI、开发者、设计者大家一起扛。

听起来很现代对吧?但这套方案有一个致命的软肋:它给不出可操作的标准

“大家一起扛”听起来公平,但实践中很容易变成”大家都不扛”。当受害者想要讨个说法的时候,弥合派的回答是:责任分散在系统里,你自己去找吧。结果往往是受害者在复杂的责任链条里耗尽精力,而真正的责任方躲在”集体负责”背后全身而退。

需要说明的是:这里是对弥合派核心困境的简化概括。实际上,不同的分布式责任理论提出了不同的分配机制——如Noh (2025)的”非人类中心主义责任”模型、Constantinescu和Kaptein (2025)的”M3方法”——但它们共同面临的挑战是:在缺乏可操作锚点的情况下,分布式责任很容易在实践中沦为”无人责任”。

第二条路,是”证明派”。

证明派的思路正好相反:别挣扎了,数学已经证明了——在某些条件下,任何责任框架都会失效。

学者 Tibebu (2026)提出了一个”问责地平线”定理:当人机集体复合自主性(即人类和AI共同构成的决策系统的整体自主程度)超过临界点、且系统存在反馈循环的情况下,不存在任何框架能同时满足”可归因性”、”可预见性”和”可干预性”这三个基本要求。这里的”反馈循环”指的是 AI 系统根据用户行为调整策略,而用户又受策略影响改变行为,形成闭环——在这种高度动态、互相嵌套的系统中,传统的责任追溯机制会面临根本性困难。

这个证明很优雅,也很重要。但它的问题在于:证明”不可能”之后呢?

证明派的学者满足于揭示极限,但当他们放下粉笔走出教室,现实世界的法庭、监管机构、政策制定者依然需要做决定。在”问责地平线”之下的可治理空间里,我们仍然需要一个分配责任的操作方案。


三、第三条路:承认鸿沟,务实分配

责任梯度模型走的是一条中间道路。

它承认:责任鸿沟在本体论(关于”什么东西存在、什么东西是什么”的哲学追问)层面确实不可弥合。AI 不是人,它不承担生存性代价,它不会被监禁、不用承受良心的谴责、不会因为一次错误决定而改变自己的人生轨迹。只要 AI 不具备这些特征,它就无法成为一个真正意义上的道德主体。

但它同时主张:在”问责地平线”之下的可治理空间内,我们不应该放弃结构化的思考。梯度,就是这个结构化方案的核心。

梯度,而不是悬崖。

我们的大脑天然喜欢二元对立:要么人类负责,要么 AI 无责。要么安全,要么危险。但真实世界里,人机协作是一个连续谱系——从完全由人类掌控的决策,到完全由 AI 自主完成的操作,中间有巨大的灰色地带。

梯度思维的关键转变在于:责任不是”有”或”无”的二元选择,而是随着决策的”重量”(即生存性代价)变化而连续调整的量。

用一个不太精确但好理解的比方:如果你只是推荐一首歌,责任很小;如果你在推荐一处房产,风险陡增;如果你在决定要不要给病人上呼吸机,责任就大到必须由人类来做最终决定——这个责任的递增过程,就是梯度。


四、CCI 6.0:一条新增的分界线

在展开责任梯度的具体分层之前,我需要解释一下为什么我们要在 CCI = 6.0 这个位置新增一条分界线。

在之前的 CCI 框架里,治理层级是三层的:高(CCI ≥ 6.0)、中(3.0 ≤ CCI < 6.0)、低(CCI < 3.0)。这个划分对”量化代价”是够用的。

但当我们的目标从”评估代价”转向”分配责任”时,三层结构就显得粗糙了。自动驾驶里的”辅助驾驶”和”高度自动驾驶”,医疗 AI 里的”生成诊断建议”和”辅助制定治疗方案”——这些场景的 CCI 可能都在 4.0 到 7.0 之间,但它们对人类介入程度的要求其实是不同的。

于是我们把中间层一分为二:

一个重要的说明:为什么从”中(3.0 ≤ CCI < 6.0)”变成了”弱委托(4.0 ≤ CCI < 6.0)”?这不是笔误,而是有理论依据的调整。在”量化代价”的语境中,3.0作为下限是合理的;但在”分配责任”的语境中,我们需要为”安全委托”(CCI < 4.0)留出空间——当 CCI 低于 4.0 时,决策的生存性代价已经降到足够低的水平,人类可以仅承担事后审计的角色。这个 4.0 分界线的依据是:当五个维度中大多数评分在 1-2 分区间时,决策几乎不涉及生存性代价。注意:这个 4.0 的下限和上一篇 CCI 文章是一致的——当时我们把”推荐系统”的 CCI 评为 1.4,远远低于 4.0。所以这个下限不是随意调整的,它基于已验证的基准案例。

CCI = 6.0 这条线的理论依据是:当”后果不可逆程度”和”时间约束压力”同时处于中高水平时,决策的生存性代价开始显著跃升,需要更强的人类介入机制来兜底。

一个方法论说明:在计算 CCI 时,我们采用等权重方案(五个维度各占 0.2)。这不是因为我们确信五个维度同等重要,而是基于”认识论谦逊”——目前还没有足够的经验证据来确定哪个维度更重要。等权重是一种谨慎的方法论选择,它让框架更容易被审计和讨论。


五、四层责任梯度

好了,现在我们可以来看看责任梯度的全貌了。

方法论说明:以下责任比例(70%/30%、40%/60%、20%/80%)是伦理框架层面的参考基准,用于指导制度设计和政策讨论,而非法律上的过错认定或赔偿分配比例。具体情境中的比例可能因案件情节而有所调整。这些数字反映的是在特定 CCI 区间内,人类与开发者在责任分配中的一般性原则——它们提供的是方向性指引,而非精确公式。

第一层:强制人类保留(CCI ≥ 8.0)

人类角色:决策者,100% 控制权。AI 角色:信息提供者。责任归属:人类 100%。

这是责任最重的层级。涉及生命存亡、根本权利的决策,必须由人类来做,AI 只能提供信息参考。

典型的例子:临终关怀决策、死刑量刑、核打击指令。

需要诚实说明的是:这一层也包含一些”框架的边界案例”。比如自动驾驶汽车面临不可避免的碰撞时,必须在两个可能的伤害对象之间做出选择——这种情况的 CCI 极高,理论上应当适用完全人类责任模式,但在极短的时间窗口内(比如几毫秒),人类在物理上根本来不及接管。这种情况下,”人类应当保留控制权”的原则本身就面临根本性挑战。这不是框架的失败,而是框架诚实地标注了它的适用边界。

第二层:有条件委托——强(6.0 ≤ CCI < 8.0)

人类角色:批准者。AI 角色:建议生成者。责任归属:人类 70%,开发者 30%。

这一层的核心特征是:AI 生成的建议具有实质性的影响力,但人类批准者必须进行实质性审查,而不是走过场。

典型案例包括:医疗诊断的最终确认、大额贷款审批。

举个例子。一套 AI 辅助诊断系统对某位病人的影像做出了”高度疑似恶性肿瘤”的判断。系统把这个结果呈现给了主治医生。在强委托模式下,医生不能简单地点”确认”——他需要查看原始影像、独立评估系统给出的依据、考虑病人的整体情况,然后做出自己的判断。如果最后还是决定做手术,责任比例是:人类 70%,开发者 30%。

这里的 70% 不是随意设定的——它反映的是:在这一层级,人类的审查义务是”实质性的”,如果审查失职,就要承担主要责任。同时,这也是基于”规范性依据”(凭什么应该这样做的理由):在高生存性代价情境中,人类是唯一能够承担不可逆后果的主体,因此应当承担主要责任。

开发者责任的法律性质:这一层级中,开发者承担的 30% 属于间接责任。具体包括:(1)产品责任——AI 系统作为产品,其提供者对系统缺陷造成的损害承担责任(如 AI 辅助诊断系统给出错误诊断导致延误治疗);(2)设计缺陷责任——当 AI 系统的设计存在固有缺陷导致损害时,开发者应承担责任(如训练数据偏差导致贷款歧视);(3)服务责任——当 AI 作为服务提供的一部分时,服务提供者对服务质量负有注意义务(如 AI 法律咨询给出误导性建议)。

第三层:有条件委托——弱(4.0 ≤ CCI < 6.0)

人类角色:监控者。AI 角色:执行者。责任归属:人类 40%,开发者 60%。

与强委托不同,弱委托的核心是:AI 基本上在自主运作,人类以监控者身份”在场”,但不需要对每一步都进行实质性审查。

典型案例:自动驾驶中的中速巡航、电商推荐系统。

想象你在高速上开着车,启动了自适应巡航和车道保持功能。车自己在开,但你坐在驾驶座上,双手虚搭方向盘,眼睛盯着路面。这是一种典型的弱委托场景:AI 负责执行”保持车距”和”车道居中”,你负责监控异常情况——比如前车突然减速,或者有车从盲区插进来。

第四层:安全委托(CCI < 4.0)

人类角色:审计者(事后审查)。AI 角色:完全自主决策者。责任归属:人类 20%,开发者 80%。

当决策的生存性代价降到足够低时,人类可以退居幕后,只在事后进行审计。

典型案例:个性化音乐推荐、高频交易算法、内容自动审核。

这个层级的关键是”事后问责”而非”事中审批”。AI 系统可以自主运行,但如果出了问题,通过事后审计追溯责任。

CCI = 2.0 的细分线:当 CCI 进一步降到 2.0 以下时(比如自动排版、邮件分类),责任的绝大部分已经转移到开发者/部署者身上,人类只承担最小程度的监督义务,开发者承担接近 100% 的责任。选择 2.0 作为分界线的依据是:当 CCI 低于 2.0 时,五个维度中大多数评分在 1-2 分区间,意味着决策几乎不涉及生存性代价——后果高度可逆、时间窗口充裕、影响范围有限。

以上就是责任梯度的全貌。听起来可能有点抽象——没关系,接下来我们用一个真实案例来检验一下。


六、用真实案例检验:Uber 事故的责任图谱

说了这么多抽象的框架,让我们用真实的案例来检验一下。

2018 年 3 月,Uber 的自动驾驶汽车在亚利桑那州撞死了一位推着自行车过马路的行人 Elaine Herzberg。

根据 NTSB(美国国家运输安全委员会)的调查,事故发生前几秒,传感器已经检测到了 Herzberg,但把她分类成了”未知物体”,没有识别为行人。系统判断需要紧急制动,但 Uber 把自动紧急制动功能禁用了——理由是避免”不稳定的驾驶体验”。事故前 1.3 秒,系统才做出反应,但为时已晚。车上的安全驾驶员 Rafaela Vasquez 在事故发生前正低头看手机。

现在,用 CCI 来评估这个决策情境:

维度 评分 说明
后果不可逆程度 10 生命丧失,完全不可逆
时间约束压力 8 系统需要在极短时间内做出反应
受影响者范围 6 涉及受害者及其家庭,对公众安全信心有广泛影响
价值冲突强度 7 涉及行人安全与交通效率的权衡
认知负荷预估 7 安全驾驶员需在复杂光照条件下保持警觉

CCI = 0.2 × (10+8+6+7+7) = 7.6

7.6 落在第二层(强委托区间)。这意味着:人类主责模式,人类 70%,开发者 30%。

具体来说:

Uber 作为开发者/部署端(30%) 承担以下责任:

安全驾驶员 Rafaela Vasquez(人类端的直接责任方) 承担监控失职的直接责任——在自动驾驶模式下没有保持应有的警觉。需要指出的是,NTSB调查发现Uber系统被设计为在撞击前不到一秒才发出警报,安全驾驶员在此之前几乎没有收到任何预警——系统设计本身就在制造”监控难以有效”的条件,这进一步强化了开发者端应承担实质责任。

有意思的是,2019 年亚利桑那州的检察官宣布不会对 Uber 提起刑事指控。但这并不是故事的结尾——2020 年,安全驾驶员 Vasquez 被亚利桑那州大陪审团指控过失杀人罪。这恰恰说明:在现行法律框架下,人类的直接过失行为仍然是可以被追责的;问题在于,开发者的设计决策——比如禁用自动紧急制动——在法律上还没有被充分纳入考量。这也印证了”责任梯度”框架的必要性:在高 CCI 情境中,既要追究人类端的直接责任,也要追溯开发者端的设计决策责任。


七、为什么不选”能动性”?

到这里,可能有读者会问:为什么不用”能动性”(agency)来作为决定责任分配的变量?这也是一条思路——AI 的自主性越强,人类承担的责任就越少。

这个思路有一定道理,但有一个根本性的问题:能动性可以告诉我们”谁参与了这件事”,但不能回答”谁该为这件事承担主要责任”。

需要先承认一点:能动性确实是责任归属的必要条件

“谁做了这件事”是追问责任的首要前提。一个完全无法行动的主体,确实无法承担任何责任。

但能动性只是必要条件,不是充分条件。它回答的问题是”主体能不能行动”,而我们真正需要回答的问题是”主体凭什么要承担后果”。

这就要说到生存性代价了。生存性代价是一个本体论概念,它回答的是:主体能不能承担行动的后果?

Uber 案例里的安全员为什么有责任?一种常见的论证是:他是”最后一个能踩刹车的人”。但这种论证容易被反驳——如果安全员当时在看手机、根本没看路,你怎么说他”能”踩刹车呢?他甚至”没有行动”!

然而,这个反驳本身是有问题的。安全员看手机恰恰是一种”不作为”(omission)——在法律和伦理上,选择不监控同样是能动性的一种表现。更重要的是,即使我们承认安全员当时”没有行动”,能动性本身仍然不能告诉我们:他应该承担多大比例的责任

这才是关键。能动性回答的是”他能不能做”,但不能回答”他该为后果承担多少”。要回答后者,我们需要引入生存性代价的维度:正是因为人类承担着生存性代价——他是血肉之躯,他有家庭,他有必死性,他无法回滚自己的人生——他才应该成为高风险决策的主要责任承担者。

能动性梯度模型(Xia, 2025)是一个重要的理论贡献,但它的决定变量——能否行动——只回答了责任归属的前提条件,没有回答责任分配的规范性依据。责任梯度的核心命题是:责任的核心不是”谁做了这件事”,而是”谁为这件事付出代价”。

顺便说明一下:系列标题中的”负主体性”是本文作者提出的概念,指的是 AI 作为一种”不具备承担生存性代价能力”的行动者,其主体性是一种”缺失”或”否定”意义上的主体性——它能行动,但不能承担。这与生存性代价的概念是一脉相承的。


八、三篇论文串起来的线索

写到这里,我想稍微停下来,帮读者梳理一下这三篇文章之间的逻辑关系。

第一篇《代价的肉身》解决的是”什么是生存性代价”——从热力学的不可逆性、必死性的嵌入、存在性纽带三个层面,建立了这个概念的本体论基础。

第二篇《CCI 框架》解决的是”生存性代价怎么量化”——把抽象的生存性代价拆解成五个可评估的维度,提出了 CCI 的计算公式。

第三篇《责任梯度》解决的是”量化之后怎么分配”——基于 CCI 的阈值划分,构建了四层责任梯度,明确了在每种情境下人类、开发者和部署者各自的责任比例。

如果用一个比喻:第一篇画了一张地图,告诉你”这里有一片责任荒野”;第二篇给荒野装上了测量仪器;第三篇则标注了这片荒野的通行规则——谁走哪段、谁负哪段的责任。


九、儒家差序格局的一点启发

最后,我想从一个跨文化的角度,聊一个可能让你觉得有点意外的话题:儒家传统里的”差序格局”。

费孝通先生提出这个概念,用来描述中国传统社会的结构——以自我为中心,一圈一圈地向外推,亲疏远近决定关系的厚薄。近的关系近管,远的远管,超出范围的,可以不管。

这个概念和责任梯度有结构上的相似性:都是从中心到边缘的递减关系。但我必须强调:相似性不等于等同。

差序格局的核心变量是关系距离——谁和我亲,谁和我疏。而责任梯度的核心变量是决策的生存性代价——这个决定有多重。两者回答的不是同一个问题。

但差序格局的思路可以给我们一点启发:责任分配从来不是一个文化中立的技术问题。不同的社会对于”谁该管谁”有不同的预设,对于”亲疏远近”的感知也不同。

比如,在东亚的医疗场景中,家庭在重大医疗决策中的参与度通常高于西方。CCI 框架里的”受影响者范围”维度会捕捉到这一点——因为家庭成员的参与确实扩大了决策的”影响圈”,进而推高了 CCI 值。但这只是一个量化参数,它并不预设哪种模式”更好”。

跨文化比较的价值在于:它提醒我们,责任分配方案不是铁板一块的——同样的技术场景,在不同的社会文化土壤里,可能需要不同的参数校准。但需要强调的是:框架的结构——即基于生存性代价进行梯度分配——是跨文化的;变化的是具体维度的评分权重,而不是框架本身的逻辑。


十、结语:框架不是终点

责任梯度模型提供了一套结构化的思考工具,但它不是终点。

它承认了自己的适用边界:当 CCI 逼近”问责地平线”时,框架的指引力会减弱。它也承认了自己的主观性:五个维度的评分依赖评估者的判断,任何风险评估工具都面临这个问题——但主观性不等于随意性,结构化的主观判断比随意的直觉更可审计、更可追问。

更重要的是,这套框架是为”可治理空间”设计的。它不声称解决了所有问题,但它希望在现有法律框架来不及更新的空隙里,提供一些可以参考的方向。

当技术跑在法律前面的时候,我们需要的不只是等待立法,还需要思考。当一个人被算法量刑、当一辆车被 AI 驾驶、当一个人的生死被某个 AI 系统”建议”了治疗方案——我们至少需要知道,这个系统在哪里、谁该为它的后果负责、人类的角色应该退到哪里、进到哪里。

毕竟,责任不是”有”或”无”的二元选择,而是随着决策的重量变化而调整的量——责任梯度,就是这个思考的起点。


作者:龍德明宇

系列文章:负主体性之责任鸿沟系列

“负主体性”:指AI作为一种”能行动但不能承担”的存在者,其主体性是一种缺失意义上的主体性。


【学术声明】

本站学术工作按理论层级组织如下:

基础理论

核心理论

展开方向

以上学术成果均由作者龍德明宇完成。各篇在其所属层级内做出独立贡献,基础理论为下游展开提供统一根基,但不替代各方向的独立论证。