实验从一个标量日志消融开始,然后追问动态信号出现在何处。静态消融(§\ref{sec:exp-static})使用推论~\ref{cor:additive-ub} 从拓扑计算残差位预算。ReAct 干预和受控重放(§\ref{sec:exp-intervention})表明同一未记录草稿板容量在计算器任务上休眠、在规划任务上活跃。§\ref{sec:diffusion-dynamic} 中的 LLaDA 探针按去噪步骤索引 $\Delta(j)$;§\ref{sec:multi-agent-private-report} 中的多智能体探针按私人对等报告边索引它。只读代理和人工合成真实校准见附录~\ref{app:proxy-bias} 和~\ref{app:synthetic}。所有流程均在单个 M4 Max 工作站上设计运行。

6.1 静态证书与日志消融

从 Qwen2.5-7B-Instruct ReAct 执行轨迹中提取时间展开 DAG,为每条未记录边分配预算 $c_e$(§\ref{sec:static-cert});未记录边上的最小割给出 $\varepsilon_{\text{state}}^{\text{UB}}$。日志记录的逐步加入将上界从 $16{,}464$ 位降至 $0$ 位。主导瓶颈是草稿板读取路径($16{,}384$ 位)。同一静态计算也为后续扩散 LM 和多智能体动态检验提供了坐标系统。

6.2 动态因果证书:干预与受控重放

在相同拓扑下分离休眠/活跃任务:未记录草稿板在两种情形下都存在,但对计算器任务无关,对规划任务则是必要的。干预扰动草稿板(掩码或替换);受控重放在保持 $\tilde T_t$ 不变的情况下彻底移除它。干预手段显示:掩码 $0.7$ 条件下规划任务的 JS 散度为 $0.0215$ 位(95% CI $[0.0094,0.0410]$),计算器任务为零。受控重放中规划任务上 JS 散度为 $0.0163$ 位(95% CI $[0.0124,0.0208]$),计算器任务为零。

在该固定拓扑下,未记录草稿板在两种任务划分中均对 $\varepsilon_{\text{state}}^{\text{UB}}$ 贡献 $16{,}384$ 位,与从提取的 ReAct DAG 得到的最小割一致。结构不可恢复性由部署边界和日志策略决定;残差决策相关性取决于任务使用的隐藏信道。

6.3 扩散 LM 上的时间证书分析

使用 LLaDA-8B-Instruct 在 $K=10$ 步去噪轨迹上,在步骤 ${2,4,6,8,10}$ 处对第 1 层激活施加高斯扰动($\sigma{=}5.0$)。模式为「晚期绑定」(late-binding):步骤 2–8 保持在低位($0.001$–$0.006$ 位),而步骤 10 升至 $0.110$ 位(95% CI $[0.052,0.234]$)。在证书几何中,LLaDA 在去噪全程携带隐藏容量;当去噪状态绑定到离散工具选择时,该容量变得与行动相关。

6.4 多智能体私人报告干预

多智能体设置再次改变索引。控制者将证据收集委托给 Worker,Worker 的私人报告不是辅助草稿板,而是决策图中的认识论边。主要干预将 Worker 报告替换为来自相反任务类别的报告,同时保持控制者协议固定。对照条件包括中性重放、同类洗牌和 Oracle 标签。

跨事实证据达到 $0.901$ 位(95% CI $[0.873,0.928]$),接近 Oracle 上界 $1.000$ 位;同类洗牌仅为 $0.084$ 位。该对比是拓扑性的:在多智能体部署中,控制者的决策通过私人 Worker 报告路由,因此活跃位点是通信边本身。

七、讨论

一张图:先看容量,再看激活。

实验是一次连续的递进。静态证书首先绘制隐藏容量可能位于何处:草稿板模块、去噪接口、对等状态边。动态证书随后追问这些位置中哪些影响了行动。在 ReAct 中,同一草稿板在计算器任务上休眠,在规划任务上活跃。在 LLaDA 中,残差容量贯穿去噪全程,但行动相关性集中在晚期绑定步骤。在多智能体部署中,委托使私人 Worker 报告成为活跃边。

因此,效应量排序是坐标上的激活剖面,而非探针间的矛盾。在该协议下,声称一个未观测变量因果性地影响行为,必须同时在 $\varepsilon_{\text{state}}^{\text{UB}}$ 中标识一个信道和在 $\delta_{\text{act}}^{\text{LB}}$ 中标识一个探针。


上一节: 五、动态证书:通过条件 DPI 的决策相关性 | 目录