六、经验诊断

实验从一个标量日志消融开始，然后追问动态信号出现在何处。静态消融（§\ref{sec:exp-static}）使用推论~\ref{cor:additive-ub} 从拓扑计算残差位预算。ReAct 干预和受控重放（§\ref{sec:exp-intervention}）表明同一未记录草稿板容量在计算器任务上休眠、在规划任务上活跃。§\ref{sec:diffusion-dynamic} 中的 LLaDA 探针按去噪步骤索引 $\Delta(j)$；§\ref{sec:multi-agent-private-report} 中的多智能体探针按私人对等报告边索引它。只读代理和人工合成真实校准见附录~\ref{app:proxy-bias} 和~\ref{app:synthetic}。所有流程均在单个 M4 Max 工作站上设计运行。

6.1 静态证书与日志消融

从 Qwen2.5-7B-Instruct ReAct 执行轨迹中提取时间展开 DAG，为每条未记录边分配预算 $c_e$（§\ref{sec:static-cert}）；未记录边上的最小割给出 $\varepsilon_{\text{state}}^{\text{UB}}$。日志记录的逐步加入将上界从 $16{,}464$ 位降至 $0$ 位。主导瓶颈是草稿板读取路径（$16{,}384$ 位）。同一静态计算也为后续扩散 LM 和多智能体动态检验提供了坐标系统。

6.2 动态因果证书：干预与受控重放

在相同拓扑下分离休眠/活跃任务：未记录草稿板在两种情形下都存在，但对计算器任务无关，对规划任务则是必要的。干预扰动草稿板（掩码或替换）；受控重放在保持 $\tilde T_t$ 不变的情况下彻底移除它。干预手段显示：掩码 $0.7$ 条件下规划任务的 JS 散度为 $0.0215$ 位（95% CI $[0.0094,0.0410]$），计算器任务为零。受控重放中规划任务上 JS 散度为 $0.0163$ 位（95% CI $[0.0124,0.0208]$），计算器任务为零。

在该固定拓扑下，未记录草稿板在两种任务划分中均对 $\varepsilon_{\text{state}}^{\text{UB}}$ 贡献 $16{,}384$ 位，与从提取的 ReAct DAG 得到的最小割一致。结构不可恢复性由部署边界和日志策略决定；残差决策相关性取决于任务使用的隐藏信道。

6.3 扩散 LM 上的时间证书分析

使用 LLaDA-8B-Instruct 在 $K=10$ 步去噪轨迹上，在步骤 ${2,4,6,8,10}$ 处对第 1 层激活施加高斯扰动（$\sigma{=}5.0$）。模式为「晚期绑定」（late-binding）：步骤 2–8 保持在低位（$0.001$–$0.006$ 位），而步骤 10 升至 $0.110$ 位（95% CI $[0.052,0.234]$）。在证书几何中，LLaDA 在去噪全程携带隐藏容量；当去噪状态绑定到离散工具选择时，该容量变得与行动相关。

6.4 多智能体私人报告干预

多智能体设置再次改变索引。控制者将证据收集委托给 Worker，Worker 的私人报告不是辅助草稿板，而是决策图中的认识论边。主要干预将 Worker 报告替换为来自相反任务类别的报告，同时保持控制者协议固定。对照条件包括中性重放、同类洗牌和 Oracle 标签。

跨事实证据达到 $0.901$ 位（95% CI $[0.873,0.928]$），接近 Oracle 上界 $1.000$ 位；同类洗牌仅为 $0.084$ 位。该对比是拓扑性的：在多智能体部署中，控制者的决策通过私人 Worker 报告路由，因此活跃位点是通信边本身。

七、讨论

一张图：先看容量，再看激活。

实验是一次连续的递进。静态证书首先绘制隐藏容量可能位于何处：草稿板模块、去噪接口、对等状态边。动态证书随后追问这些位置中哪些影响了行动。在 ReAct 中，同一草稿板在计算器任务上休眠，在规划任务上活跃。在 LLaDA 中，残差容量贯穿去噪全程，但行动相关性集中在晚期绑定步骤。在多智能体部署中，委托使私人 Worker 报告成为活跃边。

因此，效应量排序是坐标上的激活剖面，而非探针间的矛盾。在该协议下，声称一个未观测变量因果性地影响行为，必须同时在 $\varepsilon_{\text{state}}^{\text{UB}}$ 中标识一个信道和在 $\delta_{\text{act}}^{\text{LB}}$ 中标识一个探针。

上一节: 五、动态证书：通过条件 DPI 的决策相关性 | 目录

六、经验诊断

6.1 静态证书与日志消融

6.2 动态因果证书：干预与受控重放

6.3 扩散 LM 上的时间证书分析

6.4 多智能体私人报告干预

七、讨论

Comments

Leave a comment

6.1 静态证书与日志消融#

6.2 动态因果证书：干预与受控重放#

6.3 扩散 LM 上的时间证书分析#

6.4 多智能体私人报告干预#

七、讨论#

Comments

Leave a comment

6.1 静态证书与日志消融

6.2 动态因果证书：干预与受控重放

6.3 扩散 LM 上的时间证书分析

6.4 多智能体私人报告干预

七、讨论