把笔记、微信读书、知乎装进 Obsidian：我基于llm-wiki知识中枢搭建实录

Q: LLM Wiki 需要 GPU 吗？

不需要自己部署 GPU。LLM Wiki 的核心理念是让 LLM 处理你的文本，而不是让你自己跑模型。你只需要调用大模型的 API（云端推理），用它来读取你的 Markdown 文件、提取概念、生成页面和交叉引用。这个过程走的是云端 API，不需要本地 GPU。实际上整个流程的”硬件”只需要 Obsidian 和一个能调用 LLM API 的工具（如 WorkBuddy 等 Agent）。 Q: llm-wiki 和传统 Wiki 有什么区别？传统 Wiki 需要你手动创建页面、写摘要、添加内部链接，维护成本高且难以坚持。llm-wiki 把组织成本降到了几乎为零——你只需要继续产生和收集文字内容，LLM 自动读取你的 AGENTS.md 规则，反复执行摄入、更新、审计等操作，生成结构化的交叉引用网络。换句话说，传统 Wiki 是”你组织知识”，llm-wiki 是”AI 帮你组织知识”。 Q: 知识蒸馏和人格蒸馏有什么不同？两者共享同一套原始素材，但目标和产出完全不同。**知识库（Wiki）**回答”我知道什么”——从笔记和读书摘录中提取客观知识，生成概念页面和交叉引用。**人格蒸馏

TL;DR 用Obsidian+LLM Wiki打造知识中枢，打通博客、微信读书和知乎

前段时间，偶然看到karpathy大神提出的llm-wiki, 有种相见恨晚的感觉。我一直是很喜欢写些东西的，但是写完之后，问题就是大量内容散落在各个地方，一直没有精力对它们进行有效的管理。而看到了llm-wiki后，我就意识到，之前写的那些东西，要开始发挥作用了。

为什么需要知识中枢

首先, llm-wiki是什么。

llm-wiki 是 Andrej Karpathy 在最近提出的一个概念：把你过往积累的所有文字材料——笔记、博客、读书摘录、工作日志——作为”语料库”，让 LLM 自动从中提取概念、建立页面、编织交叉引用，最终形成一个结构化的、可持续迭代的个人 Wiki。

它的核心前提很简单：每个人在日常工作和学习中已经产生了大量有结构、有见解的文字，只是它们散落在各处，缺乏关联。llm-wiki 要做的就是用一个 LLM 驱动的流程，把这些散落的珍珠串起来。你负责持续产生和收集内容，LLM 负责组织和管理。

和传统的手动 Wiki 维护不同——建页面、写摘要、加链接，枯燥且难以坚持——llm-wiki 把组织成本降到了几乎为零。你只需要告诉 LLM 你的知识库结构和维护规则（即一个 AGENTS.md 文件），它就能反复执行摄入、更新、审计等操作。我自己实践下来的感受是，看着 AI 把零散笔记变成结构化的交叉引用网络，有一种”债务清零”的快感。

数据接入

我做的第一件事，就是把之前在notion里写的各种笔记，有开发知识、投资知识，还有各种各样零碎的记录，都导出然后放到了obsidian里。

如何将 Notion 内容导入 Obsidian？

实际操作并不复杂，核心步骤如下：

导出 Notion 数据：在 Notion 的”设置与成员 → 设置”中，选择”导出所有工作区内容”，格式选 Markdown & CSV。导出后会得到一个 ZIP 包，解压后每个 Notion 页面对应一个 .md 文件，数据库则额外附带 CSV。注意：Notion 免费版每次只能导出一个工作区，如果你有多个工作区，需要分别操作。
安装 Obsidian Importer 插件：在 Obsidian 社区插件市场搜索”Importer”并安装。这个插件支持从 Notion、Bear、Evernote、OneNote 等多种工具一键导入，会自动处理图片附件和内部链接。启用插件后，用 Cmd+P 打开命令面板，搜索”Importer: Open Importer”，选择 Notion 格式，选中刚才解压的文件夹即可。
手动导入（备选方案）：如果不使用 Importer 插件，直接将解压后的文件夹放入 Obsidian vault 目录即可。Obsidian 原生支持 [[wiki-link]] 格式的内部链接，Notion 导出的 Markdown 中的链接通常已经转换为该格式。
后续处理：导入后建议将原始文件放入一个专门的子目录（比如 raw/notion-export/），标记为”不可修改”。这样保留了原始数据的完整性——这是 llm-wiki 方法论中很重要的一环：原始素材永不可改，LLM 在此基础上生成结构化知识。如果你的 Notion 中有数据库，CSV 文件可以作为参考保留；如果某些页面嵌入了 Notion 特有的 Block（如日历、看板），导出后这些会丢失交互性，但文本内容会保留。

整个流程走下来，我几千条分散的笔记就这样汇入了 Obsidian，成为了知识中枢的第一批”原料”。

然后将karpathy那篇gist喂给AI, 生成出项目的AGENTS.md文档，AI能够自然的写出llm-wiki所需的摄入、审计等操作。

接着就可以执行了。看着AI不停的生成wiki内容，把我之前的积累分类整理，还是非常舒适的。

再往后，我又做了几件事，就是把知乎的创作和微信读书的笔记也纳入进来。知乎上我写了上千篇回答，微信读书几年读了上百本书，除了笔记之外，这些也是我知识体系的重要组成部分。正好，差不多那段时间，微信读书发布了官方的skill, 我也就顺手用了起来。

知乎收藏导入

如何将知乎创作同步到 Obsidian？

知乎没有提供官方的数据导出 API，这里我用 Playwright 做了浏览器自动化。

操作步骤：

安装 Playwright：pip install playwright && playwright install chromium
首次运行脚本，在打开的 Chromium 浏览器中扫码或密码登录知乎
登录成功后脚本自动遍历个人主页，抓取所有回答、文章和想法
登录状态持久化保存到本地，后续通过 --reuse 参数静默执行，无需再次登录

特点：增量同步，每次只抓取新内容，已有文件不重复处理；按回答/文章/想法分类存放。

微信读书笔记同步

如何将微信读书笔记同步到 Obsidian？

微信读书开放了 Agent API Gateway，申请 API Key 后即可调用。

操作步骤：

调用 /user/notebooks 接口获取有笔记的书籍列表
对每本新书，分别拉取划线和想法内容
按章节分组，输出为规范的 Markdown 文件

输出格式：书名和作者作为标题，每章划线以引用块形式列出（附带日期），笔记和想法附在对应原文下方。

特点：完全增量同步，脚本维护已同步书籍 ID 的状态文件，每次运行只处理新增的书籍。151 本书的笔记就这样悄无声息地流入了 Obsidian，成为了知识中枢最丰富的一批原料。

LLM Wiki 智能检索

到此，内容层的准备基本就完成了。然后我又想，既然我大部分的知识和创作都在这儿了，是不是可以开始蒸馏我这个人了？

这块先搞了一版简单的，就是把拆分出一个和wiki类似的personal流程，也有ingest、lint等流程，区别就是wiki的重点是知识，而personal的重点是我这个人。

知识库 vs 人格蒸馏：两种不同的 AI 处理逻辑

这里有必要解释一下两者的区别——它们共享同一套原始素材，但目标和产出完全不同。

知识库（Wiki）：回答”我知道什么”

从笔记、博客和读书摘录中提取客观知识，生成概念页面（如”分布式一致性”）、实体页面（如”Raft 算法”）、来源摘要页面（如”《数据密集型应用设计》读书笔记”），并在它们之间建立密集的交叉引用。目标是让知识变得可查询、可复用，像一个外部化的第二大脑。

人格蒸馏（Personal Model）：回答”我是谁”

从创作和阅读中反向推导认知模式、表达风格和价值取向。例如，通过分析技术博客，可以归纳出”论点先行、案例驱动”的表达风格；通过分析知乎回答，可以发现”第一性原理还原”和”量化思维”等反复出现的认知特征。产出不是知识条目，而是一个人的认知图谱——擅长什么、怎么思考、看重什么。

两者的异同

维度	知识库	人格蒸馏
核心问题	我知道什么	我是谁
输入	笔记、博客、读书摘录	一切个人创作和阅读记录
产出	概念/实体/来源页面 + 交叉引用	领域深度/认知特征/表达风格/价值观
方向	向外看：结构化外部知识	向内看：建模个人认知
流程	摄入 → 查询 → Lint → 审计	摄入 → 查询 → Lint → 审计（同构）

两者在流程上高度相似，但一个是向外看，结构化和整理你拥有的知识；一个是向内看，蒸馏和建模你作为个体的认知特征。这种”一体两面”的设计，是我觉得整个系统最有意思的地方。

这块最近还在看网上的女娲等项目，想看看有没有更好的蒸馏人格的方法。

效果与心得

以上就是近期关于知识库的一些实录，有想法欢迎交流。

常见问题

Q: Obsidian 适合程序员做知识管理吗？

非常适合。Obsidian 的核心理念——本地 Markdown 文件、双向链接、图谱可视化——天然契合程序员的使用习惯。Markdown 语法你本来就会，文件存储在本地意味着数据完全可控、可以用 Git 做版本管理，双向链接让你能像管理代码依赖一样管理知识之间的引用关系。加上 llm-wiki 的思路，AI 可以自动帮你从散落的笔记中提取概念、建立页面和交叉引用，把零散文档变成结构化的知识网络。

Q: LLM Wiki 需要 GPU 吗？

不需要自己部署 GPU。LLM Wiki 的核心理念是让 LLM 处理你的文本，而不是让你自己跑模型。你只需要调用大模型的 API（云端推理），用它来读取你的 Markdown 文件、提取概念、生成页面和交叉引用。这个过程走的是云端 API，不需要本地 GPU。实际上整个流程的”硬件”只需要 Obsidian 和一个能调用 LLM API 的工具（如 WorkBuddy 等 Agent）。

Q: llm-wiki 和传统 Wiki 有什么区别？

传统 Wiki 需要你手动创建页面、写摘要、添加内部链接，维护成本高且难以坚持。llm-wiki 把组织成本降到了几乎为零——你只需要继续产生和收集文字内容，LLM 自动读取你的 AGENTS.md 规则，反复执行摄入、更新、审计等操作，生成结构化的交叉引用网络。换句话说，传统 Wiki 是”你组织知识”，llm-wiki 是”AI 帮你组织知识”。

Q: 知识蒸馏和人格蒸馏有什么不同？

两者共享同一套原始素材，但目标和产出完全不同。**知识库（Wiki）**回答”我知道什么”——从笔记和读书摘录中提取客观知识，生成概念页面和交叉引用。**人格蒸馏（Personal Model）**回答”我是谁”——从创作和阅读记录中反向推导你的认知模式、表达风格和价值取向。一个向外看（结构化知识），一个向内看（建模个人认知），流程相似但方向相反。

快速上手步骤

安装 Obsidian：从 obsidian.md 下载客户端，创建本地 Vault（知识库），即为一个本地文件夹。
配置 LLM Wiki：在 Vault 根目录创建 AGENTS.md，参照 karpathy 的 llm-wiki 思路编写知识维护规则，包括摄入（ingest）、更新、审计（audit）等流程定义。让 AI 工具读取该文件，自动从原始笔记中提取概念、建立交叉引用。
导入 Notion 笔记：在 Notion 设置中导出为 Markdown + CSV 格式，使用 Obsidian Importer 插件一键导入，或将解压的 Markdown 文件夹直接放入 Vault 目录。
接入微信读书：申请微信读书 API Key，调用 /user/notebooks 接口获取书籍列表，拉取划线和笔记，按章节分组输出为 Markdown 文件存入 Vault。
导入知乎与博客：使用 Playwright 脚本自动抓取知乎回答和文章；将博客 Markdown 源文件复制到 Vault。完成后让 AI 执行一次全量 wiki 摄入，生成完整的知识交叉引用网络。