Codified Context: Infrastructure for AI Agents in a Complex Codebase

论文信息：arXiv:2602.20478 [cs.SE] 2026年2月 9页

作者：Aristidis Vasilopoulos

开源仓库：https://github.com/arisvas4/codified-context-infrastructure

📋 核心观点

当前 LLM 编程助手（如 Copilot、Cursor、Claude Code）存在一个根本性问题：缺乏持久记忆。每次会话都是全新的开始，会丢失项目约定、重复已知错误。

这篇论文提出了一个三层级上下文基础设施架构，通过文档即基础设施的理念，让 AI Agent 在复杂代码库（10.8万行 C# 分布式系统）中保持连贯性。

1. 触发器表 (Trigger Table)

2. Hot/Cold 内存分离

3. 领域知识嵌入

作者在 283 个开发会话中记录了详细指标：

关键发现：使用 codified context 后，跨会话的错误重复显著减少，架构一致性得以维持。

方案	特点	本文差异
单文件 manifest (.cursorrules, CLAUDE.md)	适合 <1000 行项目	扩展到 10万+ 行系统
Google Conductor	Gemini CLI 专用	跨平台可移植
AutoGen/MetaGPT	关注 Agent 协作机制	关注知识结构化
Cursor 代码索引	索引代码本身	索引关于代码的知识

1. 文档即基础设施

2. 分层知识管理

3. 领域专家 Agent

这篇论文为大规模 AI 辅助软件开发提供了一个实用的基础设施蓝图。核心思想是：与其工程化单个提示，不如工程化项目知识。

对于正在使用 Claude Code、Cursor 等工具进行复杂项目开发的团队，这套三层架构值得参考实践。