静态证书从部署拓扑对 $\varepsilon_\text{state} = H(S_t \mid \tilde T_t)$ 给出上界。不在可见轨迹中但能影响 $S_t$ 的信息必须通过未记录信道传输。对这些信道在最坏情况下容量的有界化,即给出了隐藏状态熵的上界。

4.1 时间展开部署图与组件预算

令 $G_t = (V_t, E_t)$ 为截至第 $t$ 步的部署时间展开有向无环图(DAG)。节点是状态更新、工具调用、内存读/写、消息;边是信息信道。三类对象:未记录源 $U_t$(检索结果、外部内存、未记录消息)、可见轨迹 $\tilde T_t$ 和有效状态 $S_t$。令 $\mathcal{C}_\text{unlogged}$ 为所有分隔 $U_t$ 与 $S_t$ 的可达边割集。

一组边称为软件正交的,如果在以 $\tilde T_t$ 为条件的联合分布下,信道输出可因式分解:$p({y_e}{e \in E’} \mid {x_e}, \tilde T_t) = \prod{e \in E’} p(y_e \mid x_e, \tilde T_t)$。当未记录信道使用独立的 API 调用或分离的内存区域时,这一条件成立(非正交情形的补救处理见附录~\ref{app:netinfo})。

引理(加性分解):在软件正交性且每条边具有预算 $c_e$ 的条件下,诱导割容量可分解为:$C_\text{cut}(\Omega) \leq \sum_{e \in E(\Omega, \Omega^c)} c_e$。

当软件正交性不成立时(例如两条未记录信道共享一个隐藏状态变量),每条边的求和 $\sum_{e \in E(\Omega, \Omega^c)} c_e$ 仍然通过跨耦合信道的互信息次可加性构成 $C_\text{cut}(\Omega)$ 的上界:$I(X_\Omega; Y_{\Omega^c} \mid \tilde T_t, X_{\Omega^c}) \leq \sum_e I(X_e; Y_e \mid \tilde T_t) \leq \sum_e c_e$。正交性是加性分解紧致性的要求,而非上界有效性的要求(形式化处理见附录~\ref{app:netinfo})。

每条边的预算 $c_e$ 从接口规格中读取:对词汇表 $\mathcal{V}$ 上 $K$ 令牌的文本信道为 $K \log |\mathcal{V}|$,对 $d$ 维量化状态为 $d \log Q$,对离散调度器为 $\log |\Omega_\text{states}|$。离散化参数 $Q$ 是审计者的可选参数(本文使用 $Q=256$,即 8 位审计离散化);更紧或更粗的离散化按比例移动边界而不改变结构论断。所有边预算均为最坏情况(最大熵)预算;更紧的经验预算只会改善证书。

该边界包含三个部分。$\varepsilon_\text{nominal}$ 项是即使在完整内部轨迹下仍然存在的残差不确定性;对于一个完全检测化的软件智能体,此项通常为零。割项是为仍可通过未记录接口进入 $S_t$ 的信息设置的审计预算。有向 MI 符号在形式上为最坏情况信息流定价,而实际实现的证书仅需边预算和部署图未记录部分上的最小割。

命题(基于割集界的静态证书):对于任何分隔 $U_t$ 与 $S_t$ 的割 $\Omega$,诱导容量为 $C_\text{cut}(\Omega) = \sup_{p(X_\Omega \mid \tilde T_t)} I(X_\Omega \to Y_{\Omega^c} \mid \tilde T_t, X_{\Omega^c})$,则有 [ H(S_t \mid \tilde T_t) ;\leq; \underbrace{H(S_t \mid T_t)}{\varepsilon\text{nominal}} ;+; \min_{\Omega} C_\text{cut}(\Omega). ] 令 $\varepsilon_{\text{state}}^{\text{UB}} := \varepsilon_\text{nominal} + \min_\Omega C_\text{cut}(\Omega)$,则 $\varepsilon_\text{state} \leq \varepsilon_{\text{state}}^{\text{UB}}$。

这里 $X_\Omega$ 表示进入跨越割的边的输入信号,$Y_{\Omega^c}$ 表示相应的输出信号,$X_{\Omega^c}$ 表示接收端的边界状态(形式化定义见附录~\ref{app:netinfo})。

推论(加性形式):在软件正交性下,$\varepsilon_{\text{state}}^{\text{UB}} = \varepsilon_\text{nominal} + \min_{C \in \mathcal{C}\text{unlogged}} \sum{e \in C} c_e$,即未记录子图上的离散最小割。

证明概要: 链式法则给出 $H(S_t \mid \tilde T_t) = H(S_t \mid T_t) + I(S_t; M_t \mid \tilde T_t)$,其中 $M_t = T_t \setminus \tilde T_t$。从 $U_t$ 到 $S_t$ 的每条路径均跨越某个割 $\Omega$,因此 $M_t$ 被跨割信号 $d$-分离于 $S_t$;DPI 给出 $I(S_t; M_t \mid \tilde T_t) \leq C_\text{cut}(\Omega)$。对割取最小化并代入引理即完成证明(完整推导见附录~\ref{app:netinfo})。

推论(自回归零割):如果系统是一个严格的自回归核心且 $\tilde T_t$ 包含完整的上下文窗口,则 $\mathcal{C}\text{unlogged} = \varnothing$,每个割的诱导容量为零,且 $\varepsilon{\text{state}}^{\text{UB}} = 0$。


上一节: 三、设置与审计机制 | 目录 | 下一节: 五、动态证书:通过条件 DPI 的决策相关性