Codified Context: Infrastructure for AI Agents in a Complex Codebase

论文信息:arXiv:2602.20478 [cs.SE] 2026年2月 9页

作者:Aristidis Vasilopoulos

开源仓库https://github.com/arisvas4/codified-context-infrastructure


📋 核心观点

当前 LLM 编程助手(如 Copilot、Cursor、Claude Code)存在一个根本性问题:缺乏持久记忆。每次会话都是全新的开始,会丢失项目约定、重复已知错误。

这篇论文提出了一个三层级上下文基础设施架构,通过文档即基础设施的理念,让 AI Agent 在复杂代码库(10.8万行 C# 分布式系统)中保持连贯性。


🏗️ 三层架构设计

层级 名称 规模 加载策略 作用
Tier 1 项目宪法 (Hot Memory) ~660 行 始终加载 定义代码规范、命名约定、构建命令、触发器表
Tier 2 领域专家 Agent 19个, ~9,300行 按需调用 专门处理特定领域(网络、架构、调试等)
Tier 3 知识库 (Cold Memory) 34篇文档, ~16,250行 检索按需 详细的子系统规范、设计决策、失败模式

关键创新点

1. 触发器表 (Trigger Table)

  • 根据修改的文件自动路由到对应的专家 Agent
  • 解决”不知道该调用哪个 Agent”的问题

2. Hot/Cold 内存分离

  • Hot:始终加载的约定和协议
  • Cold:按需检索的详细规范
  • 平衡上下文窗口与信息完整性

3. 领域知识嵌入

  • 专家 Agent 直接嵌入大量领域知识(而非仅依赖检索)
  • 解决”简洁偏见”导致的短提示失效问题

📊 实证数据

作者在 283 个开发会话中记录了详细指标:

指标 数值
人类提示数 2,801
Agent 调用次数 1,197
Agent 回合数 16,522
代码库规模 108,000 行 C#

关键发现:使用 codified context 后,跨会话的错误重复显著减少,架构一致性得以维持。


🔍 与现有方案对比

方案 特点 本文差异
单文件 manifest (.cursorrules, CLAUDE.md) 适合 <1000 行项目 扩展到 10万+ 行系统
Google Conductor Gemini CLI 专用 跨平台可移植
AutoGen/MetaGPT 关注 Agent 协作机制 关注知识结构化
Cursor 代码索引 索引代码本身 索引关于代码的知识

💡 实践启示

1. 文档即基础设施

  • 文档不再是”可选项”,而是 Agent 依赖的”承重构件”
  • 需要机器可读、结构化、版本控制

2. 分层知识管理

  • 不是所有知识都需要每次都加载
  • Hot memory 保持简洁,Cold memory 保持完整

3. 领域专家 Agent

  • 复杂领域需要专门化的 Agent
  • 预加载领域知识比实时检索更可靠

📚 相关研究引用

  • AGENTS.md 文件可使运行时降低 29%、输出 token 减少 17% (Lulla et al., 2026)
  • 仅 ~5% 的开源仓库采用了上下文文件 (Mohsenimofidi et al., 2025)
  • 上下文工程已成为独立学科,有超过 1,400 篇论文 (Mei et al., 2025)

🎯 结论

这篇论文为大规模 AI 辅助软件开发提供了一个实用的基础设施蓝图。核心思想是:与其工程化单个提示,不如工程化项目知识

对于正在使用 Claude Code、Cursor 等工具进行复杂项目开发的团队,这套三层架构值得参考实践。


原文链接https://arxiv.org/abs/2602.20478
开源实现https://github.com/arisvas4/codified-context-infrastructure