Google 上线 Code Wiki,与 DeepWiki 正面对决代码文档自动化赛道

1.9k 词

Code Wiki,基于 Gemini 自动生成并持续更新 GitHub 仓库文档。同一赛道上,Cognition 的 DeepWiki 已先发运行。学术界 ACL 2026 收录的独立评测显示,多智能体代码文档框架在 Claude Sonnet 4 上质量得分 68.79%,领先 DeepWiki 基线 4.73%。AI 代码文档生成从玩具进入产品竞争阶段。
Google Code Wiki 界面

1. Google Code Wiki:自动再生的仓库文档

2025 年 11 月 13 日,Google 在 Developers Blog 公开预览 Code Wiki,基于 Gemini 模型,可为任意公开 GitHub 仓库自动生成结构化 Wiki 文档。

核心机制:扫描完整代码库,生成层次化文档,每次代码 push 后自动重建。文档内含架构图、类图、序列图(Mermaid 格式),所有符号(函数、类、模块)均带链接可跳转至源码。此外内置 Gemini 驱动的问答聊天代理,以最新 Wiki 作为知识上下文。

访问方式:codewiki.google/<owner>/<repo> 直接生成。私有仓库的 Gemini CLI 扩展已在等待名单中,尚未开放。

Google 在博客中称该系统”加速代码理解”,目标场景是开发者 onboarding 和理解陌生代码库。

2. 赛道对手:Cognition DeepWiki

Cognition AI(Devin 团队)推出的 DeepWiki 在 2025 年初就已上线,访问模式相同:deepwiki.com/<owner>/<repo>

两者的技术路径差异:

维度 DeepWiki Google Code Wiki
底层模型 Devin AI(自研) Gemini
文档更新 手动触发 代码变更后自动重建
私有仓库 支持(Devin 集成) 仅公开仓库(CLI 扩展待定)
可视化 架构图 架构图 + 类图 + 序列图
多模态输出 文档 + 图表 + 对话 文档 + 图表 + 对话 + 视频介绍
开源 闭源 闭源

两者定位高度重合:输入 GitHub 仓库地址,输出可交互的知识库。区别在于 Code Wiki 强调”持续更新”——代码变了文档自动重建,而 DeepWiki 需要手动重新生成。

3. 学术评测:CodeWiki 框架超越 DeepWiki

除了 Google 的产品,学术界也给出了独立评测。FSoft AI Center 与墨尔本大学联合开发的 CodeWiki 开源框架被 ACL 2026 收录,论文标题为 “Evaluating AI’s Ability to Generate Holistic Documentation for Large-Scale Codebases”

该框架采用三阶段架构:

  1. 层次分解 — 将仓库分区为连贯模块,保留多粒度架构上下文
  2. 递归多智能体处理 — 动态任务委派,扩展至仓库级别仍保持质量
  3. 多模态合成 — 文本描述 + Mermaid 可视化(架构图、数据流图、序列图)

评测基于自建基准 CodeWikiBench(21 个仓库,86K–1.4M LOC,覆盖 8 种编程语言)。关键结果:

语言类别 CodeWiki (Claude Sonnet 4) DeepWiki 差值
高级语言 (Python/JS/TS) 79.14% 68.67% +10.47%
托管语言 (C#/Java) 68.84% 64.80% +4.04%
系统语言 (C/C++) 53.24% 56.39% -3.15%
总平均 68.79% 64.06% +4.73%

在 Python 项目 OpenHands(229K LOC)上,CodeWiki 得分 82.45% vs DeepWiki 73.04%。TypeScript 项目 Puppeteer(136K LOC)差距更大:83.00% vs 64.46%。

系统语言(C/C++)是 DeepWiki 唯一领先的类别,差距约 3 个百分点。这与 LLM 对底层语言的代码理解能力整体偏弱一致。

需要注意的是,该评测中 CodeWiki 使用的是 Claude Sonnet 4 作为后端 LLM,DeepWiki 的具体模型配置未在论文中披露。论文作者来自 FSoft 和墨尔本大学,非 Google 或 Cognition 关联方。

4. 代码文档自动化的信号

三个值得注意的点:

  • 产品化竞争已经启动:Google 和 Cognition 用几乎相同的入口模式(<product>.<domain>/<owner>/<repo>)争夺同一场景,说明这个需求的用户价值已被验证。
  • “持续更新”是差异点:代码文档最大的痛点不是”写不出来”,而是”写出来就过期”。Code Wiki 的自动重建机制如果真正可用,解决了文档维护的核心瓶颈。
  • 开源框架提供独立基准:学术界的 CodeWikiBench 是目前唯一公开可复现的仓库级文档质量评估基准,后续新进入者可以用同一把尺子衡量。