如果你的行业将AI对话视为正式记录——例如法律意见审查、医疗决策支持、金融建议生成、受监管研究——那么你需要一套真正的归档工作流。而不是“我会把重要的对话保存到下载文件夹”。
以下是审计级归档的标准,以及如何在不将对话内容上传给任何人的情况下实现该目标。
“审计级”意味着什么
对于大多数受监管的工作流,要求通常包括以下几项:
- 可复现性。 能否准确重现一年前的某个提示→输出对?
- 溯源。 能否证明哪一模型在什么参数下产生了哪个输出?
- 引用链。 对于基于研究的输出,能否追溯到所引用的来源?
- 留存。 在规定的期限内(通常为7–10年)保存记录,然后删除。
- 访问控制。 谁能读取归档?谁可以修改?能否检测到修改?
- 可导出性。 记录在需要时可迁移至后继系统或应监管机构要求提供。
供应商的聊天历史无法满足这些要求:
- 供应商会废弃旧模型;你曾经使用的GPT-3.5-Turbo-0301已经消失。
- 供应商的“数据导出”是一次性的HTML导出,不具备可审计性。
- 供应商账户暂停会导致你无法访问自己的记录。
- 供应商界面中不存在防篡改证据。
你的归档必须存放在供应商之外。
审计级记录
一个经过正确归档的AI对话应包含:
- 模型标识符 ——
gpt-5-2026-04-15,而不仅仅是“GPT-5”。 - 生成参数 —— temperature、top-p、max-tokens、系统指令原文。
- 完整提示历史 —— 每一轮对话按顺序排列,包括线程内的系统提示。
- 完整响应历史 —— 包括任何重试、备选完成(如果使用了的话)。
- 引用列表 —— 针对基于来源的回答(如Perplexity、Copilot、AI Overviews)。
- 附件文件 —— 文档参考文献,包含原始文件名+内容哈希(完整内容可选,取决于策略)。
- 时间戳 —— 导出生成的时间,以及原始对话轮次的时间戳(如可用)。
- 用户标识符 —— 运行该对话的用户(适用于多用户工作区)。
- 哈希值 —— 规范记录的SHA-256哈希,用于防篡改证据。
ChatExport AI的ZIP导出功能可直接捕获第1–7项。你只需在导出后用 shasum -a 256 archive.zip 自行计算哈希值。
技术工具链
对于小团队而言:
- ChatExport AI Pro —— 为每个对话生成ZIP文件。纯本地处理意味着对话内容在导出过程中不会触达任何第三方。
- WORM(一次写入、多次读取)存储层。 可以是:
- 启用了合规模式对象锁的AWS S3。
- 配置了不可变存储策略的Azure Blob Storage。
- 本地的仅追加文件系统或一次写入光盘介质。
- 小型元数据索引。 使用SQLite或Postgres表,每个归档对话对应一行:文件名、哈希值、模型、日期、用户、保留截止日期。
- 保留期定时任务。 删除超过保留期的记录,并记录日志。
对于较大团队,可将SQLite索引替换为受监管的文档管理系统(iManage、NetDocuments、OpenText),WORM层则替换为贵公司使用的方案。
为什么“100%本地化”在此处至关重要
导出工具本身也成为威胁模型的一部分。如果你的“AI导出工具”将对话路由到云端渲染管道——即便“只是为了生成PDF”——你就在特权对话中增加了一个不可信的中介。
ChatExport AI的安全模型 明确声明:导出的每个字节都在你的浏览器中渲染完成。Chrome调试器API负责PDF渲染;KaTeX打包在扩展包内处理数学公式;Notion API集成(Pro功能)利用你的认证直接从浏览器调用Notion——绝不经过ChatExport AI的服务器。
扩展发起的唯一网络请求是可选的Pro许可证验证,该验证仅发送加密的设备指纹,绝不包含聊天内容。你可以通过Chrome DevTools→网络标签页在导出过程中自行验证。
对于特权工作流而言,这一点至关重要。对于涉及HIPAA的医疗工作流、SEC监管的投资建议工作流也同样重要。
可投入使用的归档流程
每天结束时,团队归档管理员按以下步骤操作:
- 打开每个产生了计费/决策相关输出的AI对话。
- 使用ChatExport AI → ZIP导出。
- 将ZIP文件放入收件箱文件夹。
- 夜间脚本执行:
for zip in inbox/*.zip; do hash=$(shasum -a 256 "$zip" | awk '{print $1}') mv "$zip" "archive/$(date +%Y/%m/%d)/${hash}_$(basename $zip)" sqlite3 archive.db "INSERT INTO records (filename, hash, archived_at) VALUES ('$(basename $zip)', '$hash', datetime('now'))" done - 每季度一次,根据SQLite索引校验哈希值。任何不匹配的记录都是篡改信号。
方法不花哨,但有效。
本方案无法解决的问题
- AI输出中的幻觉事实。 这是内容审查问题,而非归档问题。
- 特权裁决。 AI辅助的法律建议是否享有特权属于法律问题——请查阅您所在司法辖区的律师协会指南。
- 真实来源争议。 如果两名团队成员运行相同提示却得到不同的输出,归档只能证明两者都发生过,无法告诉你哪个“正确”。
归档证明了AI说了什么。不证明AI是否正确。
相关链接
- /security —— 完整的隐私与安全模型。
- /for-lawyers —— 特权感知的AI使用指南。
- /for-teams —— 多席位归档工作流。