作业二:构建你的个人 LLM Wiki¶
作业目标
本周我们参考 Andrej Karpathy 提出的 LLM Wiki 工作流,练习把大模型从“即时回答器”变成“知识整理与维护者”。
完成本作业后,你应该能够:
- 用结构化方式组织一组原始材料,而不是只做线性总结
- 为特定受众或任务设计 wiki 的信息架构
- 使用 LLM 完成三类核心操作:
ingest、query、lint - 让回答能够回溯到原始材料,而不是停留在“看起来合理”
作业提交¶
-
截止日期:待教师发布时通知
-
提交: 邮件: mjay.lanlan2943914182[at]gmail.com
- 格式要求:zip文件,里面是一整个
week2-<student-id>-llm-wiki/作业目录 - 标题注明:"你的真实姓名-Agent实战-作业二"
- 格式要求:zip文件,里面是一整个
作业形式¶
本次作业采用混合制:
- 统一核心语料:所有同学使用教师提供的同一批基础材料
- 差异化视角:每位同学会被分配一个不同的目标受众/分析视角
- 轻度领域分流:每位同学还会被分配一个不重叠或尽量少重叠的补充主题包,作为扩展材料
你可以把这次作业理解为:
同一套原材料,不同的组织目标;在此基础上,再加入少量个性化扩展。
你的任务¶
你需要围绕指定材料构建一个可维护的小型 wiki。这个 wiki 至少要支持三种操作:
- Ingest:把新材料吸收进已有知识结构
- Query:基于已有 wiki 回答问题,并给出 citation
- Lint:检查矛盾、孤立页面、缺失页面、交叉引用不足等结构问题
你会收到的输入¶
教师会为每位同学分配一个任务组合:
- 一份统一核心语料包
- 一个目标视角
- 一个补充主题包
建议的目标视角示例:
- 面向完全不懂 ML 的产品经理
- 面向需要做方案选型的工程师
- 面向准备写综述论文的研究者
- 面向一年后要快速恢复上下文的自己
- 面向竞争分析人员
- 面向课程助教,重点关注概念依赖与常见误解
交付物¶
你提交的内容必须至少包含以下结构:
week2-<student-id>-llm-wiki/
├── CLAUDE.md
├── raw/
│ └── ...
├── wiki/
│ ├── index.md
│ ├── log.md
│ └── ...
└── reports/
├── queries.md
├── lint-report.md
└── schema-note.md
1. CLAUDE.md¶
这是你的 schema 文件,也是本作业最重要的部分。它至少需要说明:
- 你的 wiki 服务于谁
- 你如何划分页面类型
- 页面命名规则是什么
- 什么时候新建页面,什么时候更新旧页面
- citation 如何记录
- ingest/query/lint 三类操作各自遵循什么规则
2. raw/¶
放原始材料。要求:
- 原始材料不可被“静默改写”
- 文件命名清晰
- 能从 wiki 页面回溯到对应来源
3. wiki/¶
这是知识库本体。要求:
- 至少 6 个有效页面,不含
index.md和log.md - 页面之间有明确交叉引用
- 页面组织方式服务于你被分配的视角,而不是机械按“论文一篇一个摘要”堆叠
4. wiki/index.md¶
你需要维护一个结构化目录。至少应体现:
- 页面分类
- 每个页面的一句话说明
- 清晰的导航入口
5. wiki/log.md¶
你需要记录 wiki 的演化过程。至少记录:
- 什么时候 ingest 了什么材料
- 什么时候进行了 query
- 什么时候做了 lint
- 哪些页面被创建、更新或标记为待修复
6. reports/queries.md¶
记录至少 3 次 query。每次 query 必须包含:
- 问题本身
- 你使用的关键 prompt 或命令
- 你让 LLM 查阅了哪些 wiki 页面
- 最终回答
- 能回溯到原始材料的 citation
其中至少 1 次 query 的回答 要被回写成一个新的 wiki 页面,例如比较页、争议页、决策页或 FAQ 页。
7. reports/lint-report.md¶
至少做 2 轮 lint:
- 第 1 轮在初次 ingest 完成后
- 第 2 轮在提交前
lint 报告至少检查:
- 页面矛盾
- 孤立页面
- 缺失但应存在的页面
- 交叉引用不足
- 过时或证据不足的结论
8. reports/schema-note.md¶
写一段 300–500 字 的说明,解释:
- 为什么你的 schema 适合这个视角
- 你最重要的 2-3 个结构决策是什么
- 如果换一个受众,你会如何重构这个 wiki
最低要求¶
为避免作业退化成“摘要堆积”,请满足以下最低要求:
- 不少于 6 个 wiki 页面
- 不少于 2 轮 lint
- 不少于 3 次带 citation 的 query
- 至少 1 个由 query 结果沉淀出的新页面
index.md、log.md、CLAUDE.md三者必须完整存在
提交提醒¶
这是一份小型课程 wiki,重点不在于凑页数,而在于:
- schema 是否清晰
- query 是否真的可追溯
- lint 是否发现了真实结构问题
- 页面之间是否形成了有用的导航与交叉引用
不要把作业做成摘要堆积
以下做法不算完成作业:
- 只上传原文和摘要,没有知识结构
- 页面之间几乎没有交叉引用
- 回答问题时无法回溯到原始材料
CLAUDE.md只有空泛原则,没有实际规则lint只是写“没有发现问题”
将打包完成的成果发送到课程邮箱,标题注明:你的真实姓名-Agent实战-作业二。