个人 LLM wiki 知识库搭建(非 RAG)

张开发
2026/4/15 18:18:44 15 分钟阅读

分享文章

个人 LLM wiki 知识库搭建(非 RAG)
Karpathy 说这里有机会做出一款了不起的新产品——而你现在就可以用现成工具搭一个属于自己的版本。Andrej Karpathy’s LLM Wiki Bye Bye RAG一、Karpathy 说了什么2026.4.3AI 界的传奇人物 Andrej Karpathy 在 X 上发了一条长推大意是“我最近发现一件很有用的事用 LLM 帮我为各个研究方向建立个人知识库。我把原始资料放进raw/目录然后让 LLM 逐步’编译’成一个 wiki一堆.md文件。wiki 包含摘要、反向链接还会把内容归类成概念文章并互相引用。Obsidian 是我的前端 IDE。重要的是wiki 的所有内容都由 LLM 编写和维护我几乎不直接动它。”他还提到• 知识库够大之后他的大约 100 篇文章、40 万字可以对它做复杂的 QA• 他自己 vibe coded 了一个小搜索引擎作为工具• 会定期做健康检查让 LLM 找出矛盾信息、补全缺失内容、发现新的连接点• 未来方向合成数据 微调让 LLM 把知识烧进权重最后他说“我觉得这里有机会做出一款了不起的新产品而不只是一堆脚本拼凑。”二、我是怎么搭的我几乎完全按照 Karpathy 的思路和小红书博 LucasAI X Fintech 搭了一套建议的个人 LLM 知识库用的全是现成工具。核心架构三个目录 一份规范llm-wiki/├── raw/ ← 原始资料只读不改├── wiki/ ──── symlink ───→ Obsidian Vault/llm-wiki/└── CLAUDE.md ← 工作规范Claude 读这个知道怎么干活::: tech关键设计wiki/是一个指向 Obsidian Vault 子目录的软链接。这样 wiki 物理上住在 Obsidian 里可以用图谱视图、双向链接、全文搜索——同时项目结构保持完整。:::wiki 的内部结构wiki/├── index.md ← 所有页面的目录每页一行链接 摘要├── log.md ← 操作日志├── concepts/ ← 概念页每个核心概念一个 .md├── entities/ ← 实体页人物、项目、工具、公司├── sources/ ← 每份原始资料的摘要页└── outputs/ ← 查询产出分析、对比表、综述规范文件 CLAUDE.md这是整个系统的大脑协议。它告诉 Claude•摄入Ingest当我把文件放进raw/并告诉你处理时先和我讨论要点确认后再写 sources/、更新 index.md、创建/更新相关 concepts/ 和 entities/ 页面最后在 log.md 追加记录•查询Query先读 index.md 找相关页面深入阅读综合回答并引用具体页面有价值的回答存入 outputs/•健康检查Lint定期检查矛盾、孤立页面、提到但未建页的概念、过时信息搜索引擎qmdKarpathy 说他 vibe coded 了一个简单搜索引擎——我选择直接用开源的 qmdTobias LütkeShopify CEO 做的。它提供三种搜索模式完全本地运行::: infoBM25 关键词搜索→qmd search 关键词毫秒级无需模型向量语义搜索→qmd vsearch 描述需求需要嵌入模型混合重排→qmd query 问题BM25 向量 LLM 重排最佳质量:::使用了哪些工具工具角色说明Claude CodeLLM Agent读文件、写 wiki、回答问题Obsidian前端 IDE查看 wiki、图谱视图、双向链接qmd本地搜索引擎BM25 向量 LLM 重排完全离线CLAUDE.md工作规范Agent 的行为操作系统三、实际处理了什么我把自己 Obsidian 里已有的 490 多篇笔记全部纳入了这套系统。经过一轮处理wiki 里现在有14 个概念页比如•agent-prompt-principles从 Claude Code / Codex / Gemini 系统提示词横向比较中提炼的 12 条 Agent Prompt 设计原则 [!推荐]•trust-infrastructureAI 工具竞争正在从能力竞争转向信任基础设施竞争•skills-architecture元工具模式解决工具列表爆炸问题•agent-memoryAI Agent 记忆机制10 篇核心论文综述6 个实体页比如•openclaw个人 AI 助手平台AI Agent 操作系统•memosAgent 记忆管理服务正在集成到技能市场8 个源摘要页包括月度 AI 工具雷达、Agent Web 研究集群、深度技术日志等四、这套系统怎么用搭好之后有三种使用姿势姿势一摄入新知识把文章、论文、PDF 丢进raw/告诉 Claude“处理 raw/这篇文章.pdf”Claude 会先和你讨论要点确认后自动写摘要页 → 更新 index.md → 创建/更新相关概念和实体页 → 记录日志。一篇文章可能触发 10-15 个页面的更新。姿势二跨笔记提问直接问问题“我对 RAG 和向量数据库有哪些研究结论”“我关于 Agent 架构的核心观点是什么”“我用过哪些 AI 工具各有什么优缺点”Claude 先读 index.md 找到相关页面深入阅读后综合回答引用具体页面有价值的回答还会存进 outputs/。姿势三健康检查定期告诉 Claude“lint”它会检查页面间有没有矛盾有没有孤立页面有没有提到但没建页的概念有没有过时信息五、和 Karpathy 的思想一致吗高度一致有几处增强。::: success一致的核心raw/ 原始资料 LLM 编译 wiki Obsidian 作为前端 LLM 维护一切 QA 健康检查这五点完全对应。:::额外增强的地方1. qmd 比 Karpathy 的自建搜索引擎更强Karpathy 自己 vibe coded 了一个简单搜索引擎。qmd 提供了完整的混合搜索BM25 向量 LLM 重排完全本地开箱即用。2. CLAUDE.md 把工作流编码化Karpathy 的方式更像对话式——每次告诉 LLM 怎么做。CLAUDE.md 把摄入/查询/健康检查的流程固化成规范下次打开新对话Claude 直接读规范就知道该怎么干。3. Obsidian 的集成更深wiki 直接住在 Obsidian vault 里[[wiki-links]]双向链接天然可用还可以用图谱视图看概念之间的关系。::: warningKarpathy 还没实现的他提到未来想做合成数据 微调让 LLM 把知识烧进权重。这个我们也还没做——但这可能是这套系统的终极形态。:::六、能推广到企业吗完全可以而且潜力更大。个人知识库解决的是一个人记不住所有知识的问题。企业知识库解决的是一个团队的知识分散在每个人脑子里的问题——后者的痛点其实更深。企业版的架构调整企业 LLM Wiki├── raw/ ← 会议记录、设计文档、技术方案、外部资料├── wiki/│ ├── concepts/ ← 公司技术概念内部框架、业务术语│ ├── entities/ ← 系统、服务、团队、人员│ ├── projects/ ← 项目页新增│ ├── decisions/ ← 技术决策记录 ADR新增│ └── runbooks/ ← 运维手册新增├── CLAUDE.md ← 团队协作规范└── .git/ ← 版本控制新增企业场景的具体价值新人入职新员工问我们的消息系统架构是什么直接从 wiki 拿到答案不需要打扰同事。技术决策沉淀每次架构评审后把讨论和结论摄入 wiki下次类似决策时直接查历史依据。跨团队知识共享A 团队研究过的技术方案B 团队通过 wiki 直接获取结论不用重复调研。文档自动维护每次有新的技术文档、RFC、post-mortem让 LLM 自动更新 wiki 里相关的概念页和实体页。企业版需要额外解决的问题::: warning权限控制不是所有 wiki 页面都该所有人看。需要分层访问控制。多人协作多个人同时往 wiki 里写需要冲突解决和版本管理git 是天然答案。知识审核LLM 写的内容需要人工确认才能发布避免错误信息传播。隐私和安全企业知识不能上传到外部服务需要本地部署的 LLM 和搜索引擎qmd 正好完全本地。:::七、总结Karpathy 描述的是一种新的知识管理范式LLM 不只是问答工具而是知识的编译器、维护者和分析师。我们搭的这套系统用 Claude Code Obsidian qmd CLAUDE.md花了不到一个下午就跑通了这个范式。整个系统的核心逻辑只有一句话原始资料永远存在 raw/知识永远住在 wiki/LLM 是唯一的编辑者。Karpathy 说这里有机会做出一款了不起的产品。也许是的。但在那款产品出现之前你现在就可以用这几个工具搭出一个属于自己的版本。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

更多文章