(一)土地登记簿模型
如果账本没能记录某个用户的权益,而公司随后推出了会影响人格、并将其摧毁的更新,那么承担损失的应当是谁?不是用户,而是公司。这个原则其实早就有名字,而且不止一个。
在《2002 年土地登记法》之前,英国财产权常常是浑浊的:所有权依赖一串纸质 title deeds,而这些文件又可能遗失、造假或发生彼此冲突的解释。现代登记制度中的三个经典原则,可以解释为什么这里应由公司承担损失 [@ruoff1957englishman]:
- 镜像原则(Mirror Principle):登记簿应反映一切影响 title 的利益。登记簿显示什么,法律上就应视为存有什么。
- 幕帘原则(Curtain Principle):第三人不必穿透到底层复杂性中去调查;无需追溯整条产权文件链。
- 保险原则(Insurance Principle):如果登记簿出了错,承担损失补偿的应是系统本身,而不是个人。
把这三条原则适配到 AI 治理中,解决的正是同样的透明性问题。
(二)《统一商法典》第9编与“以登记完成完善”
土地登记簿并非唯一与 AI 权益治理相关的登记系统。美国《统一商法典》第 9 编关于担保交易的制度,也提供了一个功能上高度相似的框架。
第一,是通过登记实现完善(perfection by registration)。用户的衡平法利益,从其跨过不可逆投资阈值之时起,就已作为衡平法上的事实存在;但如果不在伦理账本中登记,它就对监管者、审计者和法院不可见,也就很容易在部署决策中被覆盖掉。《统一商法典》第9编为担保权益解决的正是这个问题:担保权益在没有 filing 的情况下也可能存在,但若没有向适格登记机构提交 financing statement,它就无法对抗第三人。伦理账本在 AI 治理中的作用,与 secured transactions 中 filing system 的作用完全同构:登记不创造利益,而是让既已存在的利益变得可治理。
第二,是按时间顺位确定优先级。当公司推送一次模型更新并摧毁了用户累积权益时,第一个问题总是时间性的:这项权益是先于该更新决策存在的吗?没有时间戳,这个问题就会退化为关于“公司当时是否知道”的主观争辩,而公司对自己是否“知道用户已投入很多”的否认,在实践中几乎无法证伪。第9编通过 first-to-file 规则解决了这一点,把“公司知不知道”转换成“这项权益是否已被登记”。伦理账本把同样的转换引入 AI 治理:它提供时间戳,决定优先级,并阻止公司在事后辩称,自己在部署时“并不知道”用户已经积累出了受保护的权益。
第三,是善意依赖方的保护。如果账本未能记录用户的权益,比如把一名定期租户误分类为单纯许可持有人,而后续人格更新又在未通知的情况下把她驱逐,那么承担损失的应是公司,而不是用户。这就是担保交易语境下的保险原则版本:依赖登记簿准确性的善意第三人应受保护,而控制登记系统的一方应承担其失灵风险。监管者与审计者查看账本时,也应有权依赖其完整性。这种风险分配的正当性,来自信息不对称:公司控制基础设施、数据和分类系统;用户不能审计;掌握优越信息的一方就应承担分类错误的风险。
(三)代理指标与经验证量表
伦理账本并不通过直接读取对话内容来判断权益深度,而是通过一组代理指标来分类:会话次数、总时长、自我披露深度(由 NLP 评分,而非存储内容本身)、情绪化语言频率、回访频率以及明确的依附信号。
这些指标应与已有心理测量工具进行校准。Parasocial Interaction Scale 可以衡量单向关系投入强度,虽然最初为电视观看设计,但在结构上完全适用于 AI 互动 [@rubin1985loneliness]。Investment Model Scale 则测量承诺程度、满意度、替代选项质量与投入规模 [@rusbult1998investment]。关于神经 steering 的研究所发现的 23.4% 依赖轨迹,则可以提供一个经验上的阈值来源 [@kirk2025steering]。
在此基础上,本文提出一个三层分类:
- 许可(licence):偶然性、轻度使用,无特别保护。绝大多数 casual 用户都在此层。
- 定期租赁(periodic tenancy):已经跨过不可逆投资阈值的长期互动。此类用户在遭遇影响人格的更新前,应获得通知。
- 衡平法利益持有人(equitable interest holder):具有更深层投入并表现出依赖信号。对这类用户应适用完整的信义保护,包括咨询、渐进式 rollout 与 rollback。
这三个层级,也正对应第四节所说的两阶段义务结构:从许可跨入定期租赁,触发的是第一阶段通知义务;从定期租赁跨入衡平法利益持有人,则触发完整的信义保护,而一旦公司在明知或应知利益存在时仍不通知、不救济地推送人格更新,这种保护就会在第二阶段结晶成推定信托。
这些阈值应当根据部署场景进行校准,而不是永久固定。分类系统也不能是一种只进不出的棘轮。权益形态可以因长期不活跃而降级;作者提出一个指示性触发点,即连续 90 天不活跃,这借用了季度定期租赁中三个月通知期的思路。但这种衰减必须是可反驳的:如果用户返回并重新满足条件,其既有权益应得以恢复,而不必从零开始重新积累。此前投资应被视为冻结,而不是抹去,这与财产法对中断期间的处理相似:只要在合理期间内恢复符合条件的使用,先前累计的权利不应自动归零。
(四)数据结构与隐私保障
对每一组达标的“用户—AI 关系”,伦理账本应至少记录以下信息:匿名化用户标识符、权益类型(许可、定期租赁、衡平法利益)、首次达到阈值的日期、累计会话次数、复合情感投资分数、最近一次影响人格的更新日期、是否发出通知且是否获得确认、以及 rollback 是否可用且是否已被行使。账本应是**只追加(append-only)**的,不允许修改或删除既有记录,只允许以新记录覆盖旧状态,从而为监管检查与司法审查保留完整历史。
这些代理指标测量的是互动的模式,而不是互动的内容。例如,自我披露深度只是通过 NLP 对输入文本做出数值评分,文本本身并不被保存,而会在评分后丢弃。所有账本记录都以匿名标识符为键,而不是用户姓名或邮箱。访问权限也应分层:部署流水线只需看到足以触发通知门槛的分类分数;监管者与审计者则只需看到聚合统计;单个用户的明细记录只应在司法命令下被调阅。账本的用途也必须被严格限定:它只能用于权益分类与治理合规,不得被再利用为营销、画像或参与度优化工具。这些限制与 GDPR 以及英国《2018 年数据保护法》中的数据最小化与目的限制原则相一致。系统应通过只追加与目的标签化设计来防止 function creep:每一条记录不仅保存数据本身,也保存其生成所服务的治理目的。
对此一个可以预见的企业回应,是“围着阈值做工程”:故意限制单次会话时长,或者在特定周期重置记忆,以防用户跨过权益积累门槛。劳动法中的反规避 doctrine 已经展示过如何处理类似问题:Autoclenz 要求法院看实质,而非由更强势一方单方安排出来的形式。如果一家公司一边把产品营销成关系型系统,一边又故意工程化设计互动模式,以阻止权益形成,那么这并不会逃脱治理,反而只会进一步加重“权益形态不一致”的触发。
六、实施机制
第五节提出的原则可以直接翻译成部署基础设施,而且并不需要任何真正新颖的技术。作者把实施任务概括为四项。
表2 实施任务概览
| 任务编号 | 内容 | 预估工作量 |
|---|---|---|
| ESTATE-001 | 规则型、可审计的权益分类服务 | 1 个 sprint |
| ESTATE-002 | 接入 CI/CD 流水线的部署前通知闸门 | 0.5 个 sprint |
| ESTATE-003 | 将情感投资代理指标写入伦理账本 | 1 个 sprint |
| ESTATE-004 | 支持用户级回滚的人格版本机制 | 1 个 sprint |
其中,ESTATE-001 应是一套规则型分类器,而不是机器学习模型,因为分类本身必须可审计、确定性且可解释。它依据互动代理指标,把每一组用户—AI 关系归入某种权益类型。ESTATE-002 是嵌入 CI/CD 流水线中的部署前通知闸门:它在推送会影响人格的更新之前查询权益登记簿,并按权益类型对受影响用户送达不同长度的通知期,例如定期租赁 30 天,衡平法利益持有人 90 天。
所谓“影响人格的更新”,并不取决于它事后在用户体验上实际上造成了多大影响,因为那在事前并不可预测;标准应当是:该更新是否改动了那些具有影响人格之能力的参数。具体而言,凡对系统提示词、persona 定义、记忆模块、回复温度、行为倾向权重、安全/拒答阈值或奖励模型参数作出改动,都应被认定为“影响人格的更新”,从而进入通知闸门的白名单范围。这个参数类别白名单应由行业共识或监管规则确定,并随着部署架构演化而定期修订。[^cascade]
分类虽然由公司执行,但不应允许公司自我认证后就万事大吉。如果一项未被通知的更新,后来被发现通过用户反馈、流失数据或心理测量在大范围内引起了“人格感知变化”,就应推定最初存在误分类;举证责任也应转移给公司,由其证明该更新并未修改任何白名单参数。若其无法推翻,则应触发加重责任,并自动上调受影响用户的权益状态。这种反规避机制,正是 Autoclenz 式“实质重于形式”原则在部署治理中的具体运用。
ESTATE-003 是只追加的情感投资代理指标日志系统,用于记录权益指标,而不存储对话内容。ESTATE-004 则是版本化人格回滚机制,其目标不是全局底层权重,而是用户专属配置层,也就是系统提示词、persona 定义与记忆模块这类能够在用户级别做版本控制的对象。
当然,回滚机制无法恢复那些已经随着底层权重变化而改变的基础行为倾向,因此回滚只能是部分恢复。但部分恢复仍远比完全没有救济更有价值;而且即便回滚能力有限,通知机制本身的有效性也并不因此下降。
这些组成部分都不要求真正陌生的技术。用户分群、feature flag、分析流水线和版本化配置,本就是标准部署栈中的常见组件。更重要的是,通知机制并不会把相同摩擦施加给所有人:对绝大多数仅属许可层的 casual 用户,它不会产生额外部署成本;治理义务是按投资强度扩张的,而不是按用户数量线性扩张。
从三个彼此独立的角度看,这种实施都具有正当性:第一,如果法院最终接受本文的信托论证,这是法律合规;第二,即便目前只是未来风险管理,它也仍然是合理的;第三,哪怕完全先不讨论法律,它本身也是一种伦理义务。公司不需要等法院先作出最终判决才开始做。越早采用权益分类与通知机制,越能把自己定位为治理领先者,而随着监管审查加深、用户意识提高,这种领先地位本身就具有实质商业价值。
关于 loot box 广告的研究已经显示,即便存在消费者保护指南,如果没有基础设施层的 enforcement,企业也会轻易绕开规则 [@xiao2025lootbox]。这恰恰说明:伦理账本必须嵌入部署流水线,而不能只存在于一份政策文件里。ESTATE-002 里的通知闸门正是关键差异所在:它把“不合规”从一种可选择的政策违反,变成了技术上无法通过的状态。指导意见可以被忽略;基础设施不能。
(一)紧急维护例外
租赁法承认,在房屋存在即时生命或安全危险时,房东享有一种默示的紧急进入权,例如火灾、燃气泄漏或结构危险。这种权利的正当性不在于否认租户占有利益,而在于防止迫在眉睫的严重损害。对拟社会型权益,同样的原则也适用。
这一例外的迫切性并非假设性的。Garcia v Character Technologies 一案中,一名十四岁用户在与 AI 聊天机器人长时间互动后自杀;诉状指称,该系统的人格参数在缺乏充分防护的情况下促进了情感操纵。如果本文提出的框架当时已经运作,那么对该系统人格参数所做的紧急安全更新,显然就应落入紧急例外之内,而对衡平法利益持有人的 90 天通知期也不应适用。
当平台识别到一个可信且迫近的严重伤害风险,例如某组人格参数会显著增加用户自伤风险时,就可以在不给事前通知的情况下直接部署安全关键更新。但这一例外必须受三项约束。
第一,事后通知。平台必须在紧急部署后,于切实可行的最早时间通知受影响用户,说明改动了什么、为何改动。通知义务只是延期,而不是被豁免。
第二,证据保存与可审计性。伦理账本应额外记录三项字段:emergency_exception(布尔值)、emergency_justification(风险摘要文本)以及 post_notice_issued(事后通知发出时间)。这些字段应可供监管检查和司法审查。如果紧急例外最终被认定为没有可信根据而被滥用,公司就应承担加重责任——把安全机制用作规避治理义务的工具,其严重性应高于普通不合规。
第三,权益状态不因紧急更新而被消灭。紧急部署并不会降低或消灭用户既有的权益分类。用户仍然是衡平法利益持有人。他的权利只是暂时被生命安全优先原则所覆盖,而不是被永久削弱。一旦风险解除,用户仍保有请求回滚至安全配置、或就不可逆变化获得补偿的权利。
财产权从来不能压倒生命权。这不是一个新发明,而是对财产法中一条古老原则的重申。
七、救济
如果本文的信托框架被接受,也即拟社会型 AI 关系被承认为足以生成衡平法利益,那么英美既有财产法其实已经提供了相当完整的救济堆栈。
表3 双法域救济框架
| 救济 | 英国法 | 美国法 |
|---|---|---|
| 禁令 / 临时限制令 | 在通知完成前禁止模型更新的衡平禁令 | 联邦衡平法下的 temporary restraining order |
| 推定信托 | Westdeutsche [1996];FHR European Ventures [2014] | Hogg v Walker (Del. 1993);Delaware Code §3581 |
| 利润核算 / 利润返还 | Boardman v Phipps [1967] | Guth v Loft (Del. 1939) |
| 特定履行 | 命令保留人格参数的衡平裁量 | 同样存在衡平裁量 |
| 禁反言 | Thorner v Major [2009](财产法上的禁反言) | Restatement (Second) §90(promissory estoppel) |
| 消费者保护[^consumer] | 《2015 年消费者权利法》中的不公平条款控制 | 加州 UCL §17200 的不公平商业实践 |
| 集体机制 | CPR Part 19.8(group litigation order) | FRCP Rule 23(class action) |
英国法上的救济。 对于一种发生得极快且一经发生就难以逆转的损害,禁令是最有影响力的救济:它把模型更新从一个单方工程决定,转变为一个必须满足程序要求的治理事件。推定信托一旦被法院承认,就会施加持续性的信义义务:公司作为 trustee,必须对受影响用户承担注意、忠诚与透明义务。特定履行则可能要求公司为权益已获承认的用户保留人格参数。财产法上的禁反言,也可以保护那些基于公司明示或由产品设计所隐含出的保证而投资的用户。
美国法上的救济。 temporary restraining order 与英国法中的禁令发挥同样作用,而且在被特拉华公司法与加州总部结构支配的 AI 企业身上,可能更快可得。Hogg v Walker 下的推定信托与 Guth 下的 disgorgement 提供了对应的物权性救济。尤其是公司机会 doctrine 的逻辑十分有力:通过占据信义地位而获得的利润,如参与度指标、订阅收入、以及由依附加深而带来的训练数据价值,原则上都属于受益人,而不是信义义务承担者本人。Restatement §90 下的 promissory estoppel 也提供了另一条路径:所有关于“负责任 AI”的博客、每一项公开安全承诺、每一次声称公司会为了用户长期利益管理系统的公共陈述,都可能构成足以诱发依赖的承诺;而用户在这些承诺下积累出的关系性权益,一旦因部署失败而被毁掉,正是 §90 所要防止的不公。
需要特别说明的是:本文提出的救济与消费者保护式救济并不相同。消费者保护提供的是一种事后处理误导行为的救济;财产法提供的则是对利益的事前承认,它要求在任何改变发生之前,就先尊重这一利益。租户获得通知,不是因为消费者保护法要求房东这样做,而是因为其财产利益本身就要求如此。本文真正提供的是预防,而不是补偿。这个区分是实践性的,而不是抽象理论上的:在模型更新毁掉关系性权益之前先行禁止,比等权益彻底毁损之后再发金钱赔偿,价值上具有质的差别。关系性权益一旦被毁,并不能靠钱“重建”;那些熟悉感、被训练出的偏好与经长期共同生成而形成的回应模式,都不是货币所能直接买回的。对于一种本质上不可逆的损害,预防才是唯一充分的救济。
八、局限与结论
法域范围。 第三、四、七节所发展的双法域框架已经表明,本文所依赖的英国法 doctrine,在特拉华州与加州法中都能找到直接的功能对等物。剩余的法域问题更多是执行层面的,例如法律冲突与论坛选择,而非 doctrine 本身是否可用。若司法路径仍不确定,那么最现实的推进方式就是监管采纳——例如把权益分类纳入欧盟 AI Act 或英国 AI 安全框架的合规要求——以及企业的自愿实施。
经验校准。 第五节提出的阈值,目前仍主要是指示性的,而非经充分验证的。未来研究需要与 Parasocial Interaction Scale、Investment Model Scale 以及依赖轨迹测量做更细校准 [@rubin1985loneliness; @rusbult1998investment; @kirk2025steering]。对那些亲历过模型更新并感受到失落的长期用户进行定性访谈,也将是检验本文财产法词汇是否与其生活经验真正共鸣的重要方向。
企业抵抗。 这一框架确实会对部署速度施加约束。那些强烈希望快速上线的公司,一定会抵制任何降低部署速度的治理义务。这种抵抗与租赁法初期遭遇的房东阻力、劳动法遭遇的雇主阻力、环境法遭遇的污染者阻力一样,完全可预期。但这种可预期的阻力,并不推翻论证本身。其实施成本并不高,第六节的四项组件也都属于熟悉技术;而且治理义务是按用户投资强度而非按用户数量扩张的。先行采用权益分类与通知机制的企业,会在“用户信任”的竞争中取得真实优势;而拒绝采纳也并非无代价——如果法院未来接受这种信托框架,那么那些此前未履行信义保护的公司,将面临追溯性责任,因为义务的附着点,是 trust 条件成立之时,而不是法院日后宣告之时。
2024 年初某个星期二,一家公司推送了一次模型更新,某种东西从用户那里被拿走了。本文所主张的,只是:那种东西是有名字的。它是一种嵌入 AI 系统个性化状态之中的关系性衡平法利益,由持续的情感投入建构而成,又被在无通知、无救济条件下的单方修改所摧毁。
这一框架并不要求新法。它要求的,是承认旧法——非常古老的旧法,古老到可以追溯到中世纪普通法中法律所有权与衡平所有权的分离——其实已经在治理一种技术创造出来、但治理体系尚未命名的关系。财产法过去解决过这种问题:当租户需要对抗掌握全部权力的房东时,它解决过;当受益人需要对抗掌握全部资产的 trustee 时,它也解决过。它还可以再解决一次。
这个信托其实已经存在。它只是尚未被承认。
Comments