跳转至

作业二:构建你的个人 LLM Wiki

作业目标

本周我们参考 Andrej Karpathy 提出的 LLM Wiki 工作流,练习把大模型从“即时回答器”变成“知识整理与维护者”。

完成本作业后,你应该能够:

  • 用结构化方式组织一组原始材料,而不是只做线性总结
  • 为特定受众或任务设计 wiki 的信息架构
  • 使用 LLM 完成三类核心操作:ingestquerylint
  • 让回答能够回溯到原始材料,而不是停留在“看起来合理”

作业提交

  • 截止日期:待教师发布时通知

  • 提交: 邮件: mjay.lanlan2943914182[at]gmail.com

    • 格式要求:zip文件,里面是一整个 week2-<student-id>-llm-wiki/ 作业目录
    • 标题注明:"你的真实姓名-Agent实战-作业二"

作业形式

本次作业采用混合制

  • 统一核心语料:所有同学使用教师提供的同一批基础材料
  • 差异化视角:每位同学会被分配一个不同的目标受众/分析视角
  • 轻度领域分流:每位同学还会被分配一个不重叠或尽量少重叠的补充主题包,作为扩展材料

你可以把这次作业理解为:
同一套原材料,不同的组织目标;在此基础上,再加入少量个性化扩展。

你的任务

你需要围绕指定材料构建一个可维护的小型 wiki。这个 wiki 至少要支持三种操作:

  • Ingest:把新材料吸收进已有知识结构
  • Query:基于已有 wiki 回答问题,并给出 citation
  • Lint:检查矛盾、孤立页面、缺失页面、交叉引用不足等结构问题

你会收到的输入

教师会为每位同学分配一个任务组合:

  • 一份统一核心语料包
  • 一个目标视角
  • 一个补充主题包

建议的目标视角示例:

  • 面向完全不懂 ML 的产品经理
  • 面向需要做方案选型的工程师
  • 面向准备写综述论文的研究者
  • 面向一年后要快速恢复上下文的自己
  • 面向竞争分析人员
  • 面向课程助教,重点关注概念依赖与常见误解

交付物

你提交的内容必须至少包含以下结构:

week2-<student-id>-llm-wiki/
├── CLAUDE.md
├── raw/
│   └── ...
├── wiki/
│   ├── index.md
│   ├── log.md
│   └── ...
└── reports/
    ├── queries.md
    ├── lint-report.md
    └── schema-note.md

1. CLAUDE.md

这是你的 schema 文件,也是本作业最重要的部分。它至少需要说明:

  • 你的 wiki 服务于谁
  • 你如何划分页面类型
  • 页面命名规则是什么
  • 什么时候新建页面,什么时候更新旧页面
  • citation 如何记录
  • ingest/query/lint 三类操作各自遵循什么规则

2. raw/

放原始材料。要求:

  • 原始材料不可被“静默改写”
  • 文件命名清晰
  • 能从 wiki 页面回溯到对应来源

3. wiki/

这是知识库本体。要求:

  • 至少 6 个有效页面,不含 index.mdlog.md
  • 页面之间有明确交叉引用
  • 页面组织方式服务于你被分配的视角,而不是机械按“论文一篇一个摘要”堆叠

4. wiki/index.md

你需要维护一个结构化目录。至少应体现:

  • 页面分类
  • 每个页面的一句话说明
  • 清晰的导航入口

5. wiki/log.md

你需要记录 wiki 的演化过程。至少记录:

  • 什么时候 ingest 了什么材料
  • 什么时候进行了 query
  • 什么时候做了 lint
  • 哪些页面被创建、更新或标记为待修复

6. reports/queries.md

记录至少 3 次 query。每次 query 必须包含:

  • 问题本身
  • 你使用的关键 prompt 或命令
  • 你让 LLM 查阅了哪些 wiki 页面
  • 最终回答
  • 能回溯到原始材料的 citation

其中至少 1 次 query 的回答 要被回写成一个新的 wiki 页面,例如比较页、争议页、决策页或 FAQ 页。

7. reports/lint-report.md

至少做 2 轮 lint

  • 第 1 轮在初次 ingest 完成后
  • 第 2 轮在提交前

lint 报告至少检查:

  • 页面矛盾
  • 孤立页面
  • 缺失但应存在的页面
  • 交叉引用不足
  • 过时或证据不足的结论

8. reports/schema-note.md

写一段 300–500 字 的说明,解释:

  • 为什么你的 schema 适合这个视角
  • 你最重要的 2-3 个结构决策是什么
  • 如果换一个受众,你会如何重构这个 wiki

最低要求

为避免作业退化成“摘要堆积”,请满足以下最低要求:

  • 不少于 6 个 wiki 页面
  • 不少于 2 轮 lint
  • 不少于 3 次带 citation 的 query
  • 至少 1 个由 query 结果沉淀出的新页面
  • index.mdlog.mdCLAUDE.md 三者必须完整存在

提交提醒

这是一份小型课程 wiki,重点不在于凑页数,而在于:

  • schema 是否清晰
  • query 是否真的可追溯
  • lint 是否发现了真实结构问题
  • 页面之间是否形成了有用的导航与交叉引用

不要把作业做成摘要堆积

以下做法不算完成作业:

  • 只上传原文和摘要,没有知识结构
  • 页面之间几乎没有交叉引用
  • 回答问题时无法回溯到原始材料
  • CLAUDE.md 只有空泛原则,没有实际规则
  • lint 只是写“没有发现问题”

将打包完成的成果发送到课程邮箱,标题注明:你的真实姓名-Agent实战-作业二