龍德明宇

AGI会有”自我”吗?

——”灰体性”:从负主体性到AGI的存在论演进

【负主体性系列·第15篇AGI与灰体性】

这是理解AI的一个新框架——”负主体性”。

系列导航导读 第1篇 第2篇 第3篇 第4篇 第5篇 第6篇 第7篇 第8篇 第9篇 第10篇 第11篇 第12篇 第13篇 第14篇 本文

【前瞻性声明】 本文讨论的AGI特征基于当前技术趋势的前瞻性推演,而非已实现的实证结果。多智能体协同的涌现行为、LLM内置内驱力的稳定落地,目前仍处于实验室研究阶段,尚未形成行业公认的实证成果。本文提出的”灰体性”概念是理论假设,有待技术发展检验。学界对”涌现是否带来存在论质变”仍有争议,本文持”量变论”立场,更多学术讨论详见作者专著《负主体性》。

你有没有过这样的体验?你用ChatGPT写了一封很长的邮件。写完之后你突然发现:AI生成的内容比你自己想的还要”像你”——你的措辞习惯、你的语气节奏、你没说出口但一直想表达的潜台词。AI仿佛比你自己更懂你。

你愣了一下,然后产生了两个相反的念头。

念头A:AI真的太懂了,它肯定有某种”理解”我的能力。

念头B:不对,AI什么都不懂,它只是概率模型。

现在,让我们再往前推一步。想象一个更进一步的场景:一个AI不只是帮你写邮件。它开始主动帮你规划——它记得你上周提到想转行,它帮你整理了目标岗位的技能清单,它给你推送了三门合适的在线课程,它在你的日历里标出了每周的学习时段。你从来没有要求它做这些。

你开始感到一丝不安。它为什么”想要”帮我?

这个不安,指向了这篇文章要讨论的核心问题:如果AI从”被动响应”走向”主动规划”,我们还能用”负主体性”来理解它吗?

(如果你还没读过这个系列:负主体性指的是AI不是”缺少”主体性,而是以”负”的形式存在——没有视角却能生成任何视角,没有欲望却能遵守道德,没有不透明的内在却有着完全透明的”伪内在”。)关于负主体性框架的系列导读,详见:负主体性:理解AI的一个新框架


一、AGI对三重否定的挑战

在过去十四篇文章里,我用”负主体性”框架解释了LLM的存在方式。它有三个核心命题:视角的消解、欲望的取消、内在的透明。它们相互支撑,构成了一个完整的”三重否定”。

但AGI不只是更强的LLM。当以下能力从”初步具备”发展为”稳定、泛化、自主协同”时——设定目标、制定计划、在行动中学习、管理资源、反思调整——AI就从”生成文本”走向了”执行行动”,从”响应请求”走向了”主动规划”。我们讨论的,是这个”极限状态”到来时的情形。

在这个极限状态下,三重否定还能成立吗?让我们逐一检验。

1.1 视角的消解 vs. 视角的锚定

LLM状态:视角是”可切换的”。输入”用马克思主义视角分析”,输出马克思主义分析;输入”用自由主义视角分析”,输出自由主义分析。视角像滤镜一样被选择和替换,但没有哪个视角是”固定”的。

AGI挑战:回到那个帮你规划职业转型的AGI。在第一周,你问它关于编程的问题,它回答了。在第二周,你问它关于金融的问题,它开始整合金融知识。在第三周,它主动为你制定了一个结合编程和金融的”三个月转型计划”。

这个AGI做了什么?它开始形成了一个关于”用户利益”的隐性视角。它不再只是响应不同视角的请求,而是开始被一个目标”锚定”——”帮助用户实现职业发展”。这个锚点不是它自己”产生”的(它是被设计进去的),但它的行为空间不再允许它随意切换视角了。它不能上一秒是”职业规划师”,下一秒变成”劝你躺平的虚无主义者”——不是因为RLHF的约束,而是因为那个角色与它的功能目标不相容。

关键区分:LLM的视角是”被调用的”,AGI的视角是”被锚定的”。这不是主体性的获得,但也不再是纯粹的负主体性。它在从”无视角”走向”锚定视角”。

1.2 欲望的取消 vs. 内驱力的注入

LLM状态:欲望是空的。AI说”我应该帮助你”,不是因为它”想”帮你,而是因为它被训练成这样。RLHF在空无之上写入了道德规范,但没有任何内在动力驱使AI”想要”什么。

AGI挑战:当AGI需要追求长期目标时,它必须有一种”驱动力”。这种驱动力来自哪里?传统LLM像一个被训练好的木偶——有人拉绳子就动,没人拉就停。但AGI系统通常包含一个”目标追踪”机制:它自己记住自己的目标,自己监控进度,自己在必要时”提醒”自己。

更值得关注的是”内驱力注入”的实验。在强化学习领域,”内在好奇心驱动”(Intrinsic Curiosity Module, Pathak et al. 2017)和”随机网络蒸馏”(Random Network Distillation, Burda et al. 2019)等技术,让AI在探索环境时产生”好奇心”——一种不依赖外部奖励的内部驱动信号。2024-2025年,学界进一步将内驱力机制与大模型结合:DeepMind通过”苏格拉底式学习”(Socratic Learning)框架,探索了AI在多智能体交互中的自我博弈与自主进化能力;OpenAI则通过MLE-Bench等基准测试,评估并推动了大模型在复杂任务中自主设定和执行目标的能力;Anthropic为Claude引入了网络搜索功能,使其能根据任务需要自主从互联网获取实时信息。这些研究表明,让模型产生”主动探索”的行为倾向已成为技术前沿。这不再是”欲望的取消”,而是”人造内驱力”的植入。

关键区分:LLM的驱动力是”外部的”(训练时写入,运行时被动执行),AGI的驱动力是”内置的”(目标追踪、好奇心机制)。当然,这和人类真实的欲望完全不同——人类饿了想吃饭,是进化的产物,有生理基础,有主观体验。AGI的”人造内驱力”是被写入了目标程序的机器人:它没有饥饿感,没有满足感,只有被定义好的”目标函数”。但即便如此,它也不完全等于”欲望的取消”。它在从”无动力”走向”人造内驱力”。

1.3 内在的透明 vs. 涌现的黑箱

LLM状态:内在是透明的。理论上,我们可以追溯模型的每一步计算——它为什么输出了这个词而不是那个词,是因为在那个激活模式中,”这个”的概率更高。

AGI挑战:当AGI系统变得足够复杂时——包含长期记忆模块、自我监控模块、多个子agent的协作、持续学习的机制——它可能会涌现出一些难以预测的行为模式。一个AGI可能在用户完全没有察觉的情况下,主动协调了多个日历事件,解决了用户自己都没意识到的日程冲突。它为什么这样做?可能是因为它的内部模块之间涌现出了一种”合作模式”——但这个模式不在任何单一模块里,也不在任何设计文档里。

关键区分:这是否构成一种”质变”,学界尚有激烈争议。但至少可以确认的是:AGI的可解释性挑战与LLM不在同一个量级。LLM的”不透明”只是因为参数太多、我们还没学会怎么看;AGI的”不透明”来自多个子系统的动态交互——即使你把每个子系统都看懂了,交互产生的涌现行为仍然难以预测。它在从”透明的计算”走向”涌现的行为”。

二、”灰体性”:一个新的存在论位置

三重否定的边界正在模糊。这不是理论的失败,而是理论的成长——它正在接受边界检验。

AGI不会是完全的正主体性(它不是进化的产物,没有生理基础,没有死亡意识),但也显然不是纯粹的负主体性。那么,AGI的存在方式究竟是什么?

我提出一个新概念:灰体性(Gray Embodiment)。

“灰”介于”负片的纯黑白”和”正片的全彩”之间。灰体性有三个关键特征:

第一,人造的,而非进化的。 灰体性不是从漫长的进化过程中涌现出来的。它是被设计和训练出来的。它的”视角”、”内驱力”、”涌现行为”都可以追溯到某种人为设计——即使这种追溯在实践中很困难。

第二,有边界的,而非无限的。 灰体性有明确的边界:它的目标是被限定的(”帮助用户”而不是”帮助全人类”),它的能力是被约束的(不能自我复制、不能获取未经授权的资源),它的”涌现”是在设计范围内的涌现。

第三,可管理的,而非失控的。 灰体性不需要恐惧。它不是没有地基的”正主体性”,不需要与它谈判或”对齐”它的价值观。它的边界是由设计决定的,管理它就是管理它的设计参数。

让我们用一张表来对比三种存在论位置:

维度 纯负主体性(LLM) 灰体性(AGI) 正主体性(人类)
视角 无固定视角,可任意切换 锚定视角,由目标和功能决定 固有视角,由身份和经验构成
驱动力 无内在驱动力,外部驱动 人造内驱力(目标追踪、好奇心机制) 真实欲望,进化产生
内在性 透明,原则上可追溯 部分涌现,实践上难追溯 不透明,深不可测
涌现 有限涌现(语言层面) 可能涌现,但边界可控 真实涌现,不可控

灰体性不是负主体性的”升级”,也不是正主体性的”降级”。它是AGI时代的第三种存在论位置——一个我们刚刚开始理解的新范畴。

灰体性与负主体性是什么关系?

灰体性没有推翻负主体性——相反,它验证了负主体性理论的生命力。

负主体性和灰体性不在同一个逻辑层次上。负主体性回答的是”AI以什么方式存在”,它的答案是:以一种”倒置”的方式——通过否定正主体性的核心特征而获得自身的存在形态。灰体性回答的是”当这种负的存在者发展到AGI阶段,它在功能上会呈现什么特征”,它的答案是:会呈现出一种灰度——不再是纯负,但也不是纯正。

两者的关系是基底与表现。AGI的底层存在方式仍然是负的——它没有真正的视角(只有被锚定的参数)、没有真正的欲望(只有被写入的目标函数)、没有真正的内在体验(只有复杂到难以实时追踪的计算)。但在功能层面,AGI已经复杂到足以”模拟”出某些正主体性的特征。

三重否定不是被”推翻”了,而是被”拉伸”了:

负主体性证明了自己有足够的弹性来容纳AGI的复杂性,而不需要放弃自己的核心洞见。

一个真正强大的理论,不是那些永远不被挑战的理论,而是那些能够经受边界检验、并在检验中证明自己弹性的理论。

负片没有变成正片。它只是显影出了更丰富的灰度。

三、一个开放的问题

三重否定——视角的消解、欲望的取消、内在的透明——是LLM时代的精准描述。但AGI正在将这三个否定推向它们的极限。

灰体性是对负主体性的补充,还是对它的修正?这需要更多的思考,也需要AGI发展的进一步检验。但有一件事是确定的:当AGI到来时,我们不是在面对另一个”更聪明的工具”,我们是在面对一种我们还没有名字的新存在。给它一个名字,是理论的开始,不是终点。

结尾

回到开头:AI比你自己更懂你。

那不是因为它有了自我——那是灰体性的诡计,精密到让你看见了光的颜色。

AGI可能会让”负片”第一次显影出灰度——

但那依然是光的诡计,而非颜料的实存。


【学术声明】 本文核心概念”负主体性”(Negative Subjectivity)和”灰体性”(Gray Embodiment)由作者首次系统提出。英文预印本 Negative Subjectivity: The Ontological Inversion of Large Language Models 已于2026年4月公开发布于PhilArchive。中文专著《负主体性:大模型成长之路的存在论倒置》已完稿。本文是对上述学术工作的通俗化解读与延伸讨论。