连载三|痛苦即信号:前向进化的生物学硬核启示
副标题:从 Prompt 注入失败,到硅基痛觉神经的诞生

开篇:智慧究竟从哪里生长出来?
既然“说明书”式的 Prompt 注入是一场灾难,那么 AI 的“智慧”究竟该从哪里生长出来?
在连载二里,我提到过一个失败实验:我曾试图把第一性原理、反脆弱、系统思维、长期主义这些抽象原则,直接写进 System Prompt。
我以为,只要模型“知道”这些原则,它就会在行动中自然遵守这些原则。
结果证明,这是一个非常天真的幻想。
它会在回复里复述原则,却在工具调用时绕过原则; 它会在计划里承诺谨慎,却在执行时继续冲动修改; 它会说“我理解第一性原理”,却在复杂代码现场里继续做局部最优。
这让我开始反思一个更底层的问题:
为什么现在的 AI 看起来总是缺乏真正的“直觉”和“底蕴”?
它明明读过人类历史上几乎所有智慧文本,为什么依然像一个刚背完书、却没有经历过现实摔打的学生?
答案可能藏在深度学习与生物学习之间的差异里。
我们今天训练模型,极度依赖反向传播:先完成一次前向计算,再根据全局误差回传梯度,统一调整参数。
但真实世界里的生命,并不是这样成长的。
一个人不是先把整个人生跑完,再从终局回传梯度。 一个组织不是先把十年战略全部执行完,再一次性更新价值观。 一个大脑也不是靠一张完美说明书,瞬间获得成熟直觉。
生物更像是在环境中不断行动、碰壁、修正。
它们依靠局部信号、即时反馈、痛感、惊讶、失败和重复经验,把外部世界一点点刻进身体。
Hinton 提出的 Forward-Forward 算法并不是 PD 的直接技术来源,但它给了我一个重要启发:学习未必只能依赖事后的全局清算,也可以依赖执行过程中的局部信号、局部目标和局部调整。
对 PD 来说,这个局部信号,就是 Pain Signal(痛苦信号)。
生物的成长,是前向的。 智慧的内化,也应该是前向的。
01 Pain + Reflection:从人生原则到反思性实践
我在 Ray Dalio 的《原则》里找到了那个著名的进化闭环:
Pain(痛苦) + Reflection(反思) = Progress(进步)
这句话非常简单,但它的力量恰恰来自简单。
痛苦本身不会让人进步。 很多人经历痛苦,只会变得麻木、怨恨、逃避。
真正让人进步的是:痛苦发生之后,系统没有立刻遗忘它,而是把它转化成可复盘、可提炼、可迁移的经验。
换句话说:
痛苦不是目的,痛苦只是信号。 反思不是姿态,反思是把信号转化为结构。
在这里,我们必须澄清一个核心概念:**在这个语境里,“痛苦”(Pain)和“失败”(Failure)绝对不是同义词。**将驱动力设定为“痛苦”而不是“失败”,正是这套体系中最精妙的底层逻辑之一。我们可以从三个维度来理解:
过程的摩擦 vs. 终点的定性失败是离散的、二元的结果(要么成功要么失败),它是事后的静态定性。而痛苦是连续的、实时的过程信号,代表着“摩擦力”。一个 Agent 可能重试了 50 次、浪费了大量 Token 才修复一个 Bug。从结果上看它没有“失败”,但过程充满了“痛苦”。如果只由“失败”驱动,只要结果成功,系统就不会优化;而“痛苦驱动”则会捕捉这些摩擦,触发反思,确保下次能一遍过。
生物学的反馈信号 vs. 客观的事件判定 一个人或系统可以经历失败,但如果没有感知到痛苦(比如觉得无所谓),就不会产生进化。痛苦在生物学上是一种强烈的保护和进化信号(如手碰热炉子立即缩回的肌肉记忆)。**痛觉,才是真正能改变神经网络权重的生物电流。**因此公式是
Pain + Reflection,而不是Failure + Reflection。反思的颗粒度与指向性失败的颗粒度太粗,只能告诉你“这条路走不通”(如 CI 挂了、PR 被拒)。而痛苦的颗粒度极细且自带坐标,能精准指向系统中真正出问题的地方(如“忘记更新 lockfile”、“处理未知数据时用了
any”)。记录下每一个具体的痛点,才能在下次遇到类似上下文时,把痛苦提前转化为原则。
总结来说,由“失败”驱动的系统,只是在练习如何**“不跌倒”(生存底线);而由“痛苦”驱动的系统,是在极其敏锐地捕捉每一次哪怕极微小的阻滞感,不断消除摩擦,最终走向“大师级的优雅与直觉”**(演化上限)。

后来我继续往下追,发现早在 1983 年,Donald Schön 就在《反思性实践者》中提出过一个更系统的框架。
他认为,真正的专家并不是简单套用书本理论的人。 顶尖实践者之所以厉害,是因为他们能在充满噪声、冲突和不确定性的现场中,持续进行两种反思:
行动中反思(Reflection-in-Action) 在遇到意外阻力时,实时刹车,现场调整。
行动后反思(Reflection-on-Action) 事后回到案发现场,重新解构问题、行动和结果。
这两个概念,几乎精准击中了 PD 后续架构的核心。
如果一个 AI Agent 只会在任务结束后说“抱歉,我下次会注意”,那它没有真正反思。 如果一个 AI Agent 只会在输出里写“我将遵循第一性原理”,却无法在高风险操作前主动刹车,那它也没有真正内化原则。
现在很多 AI 之所以仍像“打字员”,不是因为它不会说大道理,而是因为它没有痛感。
当你纠正它的错误时,它会道歉。 当你指出它破坏了架构时,它会承认。 当你让它重写时,它会重新生成。
但到了下一个文件、下一个任务、下一个上下文窗口,它很可能继续犯同样的错误。
这不叫进步。
这叫复读。
PD 项目的中期,我越来越确定一件事:
要把原则种进 AI 的行为系统里,不能只给它说明书。 必须让它经历“痛感—刹车—复盘—沉淀”的前向进化循环。
02 从“知道”到“忘记”:成为大师的必经之路
让我讲一个发生在我身边的真实故事。
我曾经向我太太深度科普过“第一性原理”。
她认真去看了相关书籍和商业案例,也尝试用这个原理做一些生活中的决策练习。
当时我非常开心,甚至有点天真地以为:她已经“学会”了,她的人生和行为模式马上就要迎来一次高维蜕变。
但现实很快打了我的脸。
当她遭遇真实、复杂、带有情绪压力的现实摩擦时,很多时候依然会凭借旧的惯性和直觉行事。
后来我意识到,这个故事里的主角不只是她,也包括我自己。
我们都太容易把“理解一个概念”,误以为“已经拥有了这种能力”。
但其实:
“知道”一个概念, “理解”一个概念, 和将其“融会贯通”, 完全是不同层级的存在。
要成为真正的大师,必须经历历练。
你必须在真实生活中磕磕碰碰,吃过亏,受过痛,经历过强烈摩擦,才会让一个抽象原则与你的真实处境产生强关联。
曾国藩年轻时也并不是天生的圣人。他不断写日课、记过失、接受他人的批评,用近乎笨拙的方式,把外部规训一点点压进自己的行为系统里。
这件事给我的启发是:
原则不是靠“记住”内化的。 原则是靠“反复在痛处被触发”内化的。

只有当一个原则在你的脑海里长出具体枝叶,变成底层的肌肉记忆,深深融入骨髓,直到最后你甚至忘记了“第一性原理”这几个字,但每一次举手投足都在自然践行它时,你才算真正跨越了鸿沟。
Schön 把这种状态称为 Knowing-in-Action。
也就是:你不再需要调用一条原则,因为你已经活成了那条原则。
今天的大模型也是如此。
它读过无数关于第一性原理的文本,却不代表它在行动中内化了第一性原理。
把人类智慧写进 Prompt,最多只能让 AI 停留在“知道”的表层。
如果不让它在真实的代码废墟里经历“磕碰—复盘—修正”的循环,它永远只是一个挂着哲学铭牌的做题家。
03 建立硅基的“痛觉神经”
所以,在 Principles Disciple(PD)的新架构中,我引入了 Pain Signal(痛苦信号) 机制。
但这里必须先澄清一点:
Pain 不是惩罚。 Pain 也不是把 AI 拟人化成会受苦的生命体。
在 PD 里,Pain 是一种系统信号:当 AI 的行为造成返工、风险、熵增、权限阻塞或目标偏离时,系统必须把这种代价显性化,并触发降速、记录和反思。
人类的痛觉,是为了让身体识别伤害。 PD 的痛觉,是为了让 Agent 识别行为代价。
如果没有痛觉,Agent 就会把一切错误都当成普通上下文。
写烂代码?改掉就行。 破坏架构?道歉就行。 反复返工?继续生成就行。 绕开原则?下次注意就行。
这就是问题所在。
没有痛觉,错误就不会留下痕迹。 没有痕迹,反思就无法发生。 没有反思,原则就不会生长。
因此,PD 需要一套“硅基痛觉分级体系”。
1. 底层痛觉:人类痛感的投影
最直接的 Pain 来自开发者。
当你在 Code Review 中愤怒地驳回一个 PR,或者你发现 Agent 写出的代码正在制造架构灾难时,这种人类挫败感不能只停留在一句“这不对”。
它应该被系统捕捉,转化为最高优先级的 Pain Signal。
因为在真实项目中,人类的愤怒往往不是情绪噪声,而是系统代价的集中体现:
- 它浪费了你的时间;
- 它破坏了已有边界;
- 它增加了未来维护成本;
- 它让你对 Agent 的信任下降。
这些都是真实世界的痛感。
2. 中层痛觉:系统摩擦的量化
第二层 Pain 来自系统自身。
并不是所有错误都需要人类亲自指出。 很多“正在变坏”的迹象,可以由系统自动观察。
例如:
- Agent 在同一段逻辑上反复修改,却没有实质进展;
- Diff 不断膨胀,但测试覆盖没有增加;
- 权限错误、构建失败、lint 失败频繁出现;
- 修改范围持续扩大,任务目标却没有更清晰;
- 多次工具调用只是制造噪声,没有推进目标。
PD 会把这些散落的异常信号压缩成一个统一指标,我暂时称之为 GFI(Global Friction Index,全局摩擦指数)。
GFI 不是为了炫技。
它只回答一个非常朴素的问题:
这个 Agent 现在是不是正在用很高的成本原地打转?
如果答案是是,那么系统就不应该继续纵容它“努力执行”。
努力不等于进步。 高频操作也不等于有效行动。
3. 高级痛觉:目标偏离的虚无感
第三层 Pain 来自长期目标。
这是最重要、也最难的一层。
在长程任务中,Agent 有时看起来非常勤奋: 它不断修改文件,不断运行命令,不断提交结果,不断解释自己的行为。
但从更长时间轴看,它可能只是在瞎忙。
例如:
- 频繁
git revert,说明它在反复推翻自己; - 不断扩展 scope,说明它正在逃离原始目标;
- 修复一个 bug 却引入三个新 bug,说明它在用局部补丁污染系统;
- 追求当前任务完成,却破坏了项目长期架构方向。
这种痛苦不是“报错”带来的,而是“目标偏离”带来的。
它更像一种认知层面的虚无感:
我做了很多,但我没有变得更接近目标。
如果一个 Agent 无法感知这种痛感,它就会变成一个极其勤奋的灾难制造机。
![]()
一个更前置的问题:眼睛决定世界
但在继续往下讲之前,必须再往前问一步:
大语言模型不具备天生的痛觉神经。
人类的痛觉是硬连线的——手碰到火,神经系统在毫秒内完成感知、传导、反应,不需要任何额外设计。但 AI Agent 的"痛觉"必须由外部系统显式构造。你不构造,它就感知不到。感知不到,就不会反思。不反思,原则就不会生长。
这意味着一个常被忽视的事实:
Agent 能感知到的失败种类,不是一个自然事实,而是一个产品设计选择。
你给 agent 一双什么样的眼睛,它就只能看见什么样的世界。
一个只能感知到"工具调用失败"的 agent,再聪明的诊断器也只能围绕工具调用打转。 一个能感知到"目标正在偏离"的 agent,才有机会让人类基于这类证据做出更有意义的判断。 一个能感知到"用户在反复纠正"的 agent,才有机会沉淀出与人类期待对齐的原则。
这三层感知,并不会自动产生三层智慧——感知到只是必要条件,不是充分条件。但没有感知,连必要条件都不存在。
所以 PD 在 Pain Signal 之外,还要持续追问一个更朴素的问题:
Agent 该看见什么?我们有没有给它足够宽的感官?
memory layer、learning layer 这几年都被反复讨论,但 sensing layer——"agent 该如何感知自己什么不对"——是一个被讨论得明显较少的层。这层做得多深,可能决定了一个 agent 系统的天花板在哪里。
04 Pain 越过阈值之后,会发生什么?
在 PD 的世界里,一次 Pain 越过阈值,不会只是生成一句道歉。
它会触发一组连锁反应。
1. 强制刹车:Reflection-in-Action
第一步是强制刹车。
当系统判断当前执行流已经出现明显风险时,PD 会物理阻断继续执行,强制降速。
这对应 Schön 所说的 Reflection-in-Action。
也就是:不是等整个任务彻底失败之后才总结,而是在行动现场识别阻力、暂停惯性、重新判断。
这一步非常重要。
因为很多灾难并不是发生在“完全不知道怎么办”的时候,而是发生在“看起来还能继续做”的时候。
Agent 会倾向于继续生成。 继续修改。 继续补救。 继续解释。
但 PD 必须在某些时刻说:
停。 不要再用行动掩盖判断缺失。 先回到问题本身。
2. 场景固化:把错误从烟雾变成标本
第二步是场景固化。
一次错误如果没有被记录,很快就会变成烟雾。 你只记得“它又翻车了”,但不知道它到底在哪里开始偏离。
所以 PD 需要捕捉这一刻的关键上下文:
- 当时的目标是什么?
- Agent 参考了哪些文件?
- 它执行了哪些工具调用?
- 它为什么选择这条路径?
- 哪个信号最早暴露了风险?
- 人类在哪个节点介入?
- 最终代价是什么?
这些信息会被写入可追溯的 Decision Ledger(决策账本)。
不是为了审判过去,而是为了让未来的系统拥有记忆。
没有账本,经验就会蒸发。 没有经验,痛苦就只是痛苦。
3. 前向反思:Reflection-on-Action
第三步是前向反思。
我原来把这个环节称为“审讯室”,但后来意识到这个词有惩罚意味,不够准确。
更合适的名字是:
复盘舱。
AI 会被带入一个特殊的复盘上下文里。
在这里,它不能继续急着修代码。 它必须面对刚刚发生的错误现场,拿着那条抽象原则,重新解释这次失败。
例如:
原则:三思而后行。 现场:未同步分支状态下强制修改多个文件,导致冲突扩大。 复盘问题:当时应该触发什么检查?下次遇到类似场景,什么条件必须先满足?
这个过程必须消耗额外 Token。
这件事很重要。
因为在系统设计里,成本本身就是信号。
如果每次翻车都必须付出额外计算代价、额外记录代价、额外复盘代价,那么 Agent 的行为系统才会逐渐形成一种新的倾向:
不要轻易制造痛苦。 在高风险动作前先暂停。 先判断,再执行。
这才是 PD 所谓的“前向进化”。
不是训练结束后的全局反向传播, 而是在行动过程中,用局部痛觉信号改变未来行为。
05 从文字记忆到“枝叶生长”
通过 Pain Signal,原则不再是浮在半空中的鸡汤。
它会变成一次次真实摔跤后的教训。
这就是我说的:
让原则在不同土壤里长出枝干和叶子。
一粒“三思而后行”的种子,写在 Prompt 里时,只是一句漂亮的话。
但当它被 Pain Signal 反复触发,就会在不同场景里长出不同形态。
在处理 Git 冲突的土壤里,它会长成:
必须先拉取最新分支,严禁在未同步状态下强制推送。
在重构旧逻辑的土壤里,它会长成:
严禁修改超过 100 行核心逻辑且没有单元测试支撑。
在跨文件修改的土壤里,它会长成:
修改超过 3 个关键文件前,必须先生成影响范围清单。
在权限受限的土壤里,它会长成:
连续两次权限失败后,禁止继续尝试同一路径,必须切换策略或请求人类确认。
在目标模糊的土壤里,它会长成:
需求边界未明确前,只能提出方案,不能执行破坏性修改。
这些枝干和叶子,才是真正的高维认知。
因为它们不是抽象概念。 它们是具象的、可执行的、可触发的、带有防御性的知识。
这就是从“知道”到“内化”的关键转换。
Prompt 里的原则,是文字记忆。 Pain 之后沉淀下来的规则,是行为记忆。
文字记忆容易遗忘。 行为记忆才会改变下一次动作。
06 下一个问题:智慧太多,会不会压垮系统?
但问题接踵而至。
如果每一次 Pain 都长出一条新规则,每一次失败都沉淀一片新叶子,那么原则之树会不会很快变得过于繁茂?
枝叶越来越多,规则越来越密,检查项越来越复杂。
最后会不会出现另一种灾难:
AI 因为学到了太多“智慧”,反而被智慧压垮,变得行动迟缓、上下文臃肿、判断混乱?
这不是一个小问题。
真实的生物脑并不是无限保留所有连接。 它会进行 突触修剪(Synaptic Pruning):把高频、稳定、重要的模式保留下来,把低价值、重复、过时的连接剪掉。
换句话说,真正的学习不只是增加记忆。 真正的学习也包括遗忘、压缩和硬化。
人类也是如此。
一个新手会背很多规则。 一个熟手会调用少数关键原则。 一个大师甚至忘记了规则的名字,却在行动中自然避开陷阱。

那么在 PD 中,我们也必须回答同样的问题:
- 哪些 Pain 生成的规则应该保留?
- 哪些只是偶然噪声?
- 哪些软原则应该被硬化为代码检查?
- 哪些高频经验应该从上下文中移出,进入系统层?
- 哪些过时枝叶应该被剪掉?
这就是连载四要进入的主题:
软硬转换炼金术。
如果说 Pain Signal 解决的是“原则如何生长”,那么软硬转换要解决的就是:
原则如何被压缩、硬化、迁移,最终从提示词变成系统本能。
结语:智慧不是被灌输的,而是被痛感雕刻出来的
连载一里,我讨论了为什么 AI 时代最稀缺的不是执行力,而是判断力。
连载二里,我记录了 Prompt 注入实验的失败: 把智慧写进自然语言,并不能稳定改变 Agent 的行为。
而连载三,我越来越确信:
智慧不是被灌输的。 智慧是被痛感、反思和真实反馈雕刻出来的。
对人是如此。 对组织是如此。 对硅基系统也应该如此。
PD 的 Pain Signal,并不是为了惩罚 AI。 它是为了让错误拥有重量,让反思拥有现场,让原则拥有生长的土壤。
没有 Pain,原则只是鸡汤。 没有 Reflection,痛苦只是噪声。 没有 Progress,系统只是复读。
而再往前一步,还有一个常被忽视的前置:没有足够宽的感官,agent 连"哪里疼"都不知道。痛觉的种类决定了反思能指向的位置,反思能指向的位置决定了原则能生长的土壤。
真正的智慧,必须从一次次前向行动中的摩擦里长出来。
如果你想看我们如何把哲学编译成代码,请期待连载四:软硬转换炼金术。
— 一根芦苇