<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>AI审计 on My Hugo Project</title><link>https://ostensible-paradox.pages.dev/zh/tags/ai%E5%AE%A1%E8%AE%A1/</link><description>Recent content in AI审计 on My Hugo Project</description><generator>Hugo</generator><language>zh</language><lastBuildDate>Fri, 15 May 2026 11:20:17 +0000</lastBuildDate><atom:link href="https://ostensible-paradox.pages.dev/zh/tags/ai%E5%AE%A1%E8%AE%A1/index.xml" rel="self" type="application/rss+xml"/><item><title>智能体审计的双重证书：分离结构不可恢复性与决策相关性</title><link>https://ostensible-paradox.pages.dev/zh/posts/dual-certificates-agent-audit/</link><pubDate>Fri, 15 May 2026 11:20:17 +0000</pubDate><guid>https://ostensible-paradox.pages.dev/zh/posts/dual-certificates-agent-audit/</guid><description>对已部署的语言模型智能体进行审计，需要两个可分离的量：多少有效操作状态逃逸了记录轨迹，以及这些残差状态中有多少驱动了行为。本文提出一个双重证书协议（dual-certificate protocol）。静态证书 $\varepsilon_{\text{state}}^{\text{UB}}$ 通过未追踪信道上的最小割对残差隐状态熵给出上界。动态证书 $\delta_{\text{act}}^{\text{LB}}$...</description><content:encoded><![CDATA[<h2 id="摘要">摘要</h2>
<p>对已部署的语言模型智能体进行审计，需要两个可分离的量：多少有效操作状态逃逸了记录轨迹，以及这些残差状态中有多少驱动了行为。本文提出一个双重证书协议（dual-certificate protocol）。静态证书 $\varepsilon_{\text{state}}^{\text{UB}}$ 通过未追踪信道上的最小割对残差隐状态熵给出上界。动态证书 $\delta_{\text{act}}^{\text{LB}}$ 通过一个在条件数据处理不等式（conditional DPI）框架下可容许的探针分类体系——重放（replay）、干预（intervention）、代理（proxy）——对残差决策相关性给出下界。这两个轴是独立的。在 ReAct 实验中，日志记录将静态边界从 $16{,}464$ 位逐步消减至 $0$ 位；受控重放将休眠计算器任务与活跃规划任务在相同拓扑下区分开来——软策略偏移为 $0.0163$ 位，95% CI $[0.0124,0.0208]$——argmax 工具选择保持不变。将 $\delta_{\text{act}}^{\text{LB}}$ 索引化到隐信道坐标上，即得到一个激活剖面（activation profile）。在 LLaDA 去噪轨迹上，扰动在早期步骤中保持接近底线，并在最终绑定步骤升至 $0.110$ 位（95% CI $[0.052,0.234]$）。在多智能体通信边上，交换一个 Worker 的私人报告给出 $0.901$ 位（95% CI $[0.873,0.928]$）。一个 Lean 4 工件对自回归零割情形进行了机械化验证，并从 Mathlib 第一原理证明了条件 DPI 和链式法则归约，仅割集容量上界保留为外生结构前提。</p>
<h2 id="关键词">关键词</h2>
<p>智能体审计（agent audit）、双重证书（dual certificates）、结构不可恢复性（structural unrecoverability）、决策相关性（decision relevance）、条件数据处理不等式（conditional DPI）、割集上界（cut-set bound）、自回归零割（autoregressive zero-cut）、Lean 4 形式化</p>
<h2 id="目录">目录</h2>
<ul>
<li><a href="/zh/posts/dual-certificates-agent-audit/%E5%BC%95%E8%A8%80/">一、引言</a></li>
<li><a href="/zh/posts/dual-certificates-agent-audit/%E7%9B%B8%E5%85%B3%E5%B7%A5%E4%BD%9C/">二、相关工作</a></li>
<li><a href="/zh/posts/dual-certificates-agent-audit/%E8%AE%BE%E7%BD%AE%E4%B8%8E%E5%AE%A1%E8%AE%A1%E6%9C%BA%E5%88%B6/">三、设置与审计机制</a></li>
<li><a href="/zh/posts/dual-certificates-agent-audit/%E9%9D%99%E6%80%81%E8%AF%81%E4%B9%A6/">四、静态证书：通过未追踪信道容量的结构上界</a></li>
<li><a href="/zh/posts/dual-certificates-agent-audit/%E5%8A%A8%E6%80%81%E8%AF%81%E4%B9%A6/">五、动态证书：通过条件 DPI 的决策相关性</a></li>
<li><a href="/zh/posts/dual-certificates-agent-audit/%E7%BB%8F%E9%AA%8C%E4%B8%8E%E8%AE%A8%E8%AE%BA/">六、经验诊断</a></li>
</ul>
]]></content:encoded></item></channel></rss>