> ma-le.cn
$ cat /ai/ai知识库搭建第一步obsidian从0到1的经验分享.md

AI知识库搭建第一步:Obsidian从0到1的经验分享

· 14 min

承接上一篇《AI时代,我建议你从这三件事开始做起》。

第一件事,装Obsidian。

安装很简单,官网下载。如果你之前没有云笔记本或知识库,可以直接跳到第二章节。如果之前用印象笔记或是OneNote存的笔记,先从第一章数据迁移看起


一、数据迁移:AI很强,但也要小心

印象笔记到Obsidian最常见的方法是通过.enex导出,官方插件和网上的各种方法,都走的这条路。

这里就遇到一个严重的问题:印象笔记中国版不再支持enex导出,只能导出.notes格式,而目前全网都没有支持这个新格式的工具。

尝试了各种方法,比如卸载印象笔记,装上之前还支持.enex的老版本,不行。试了网页版印象笔记,还是不行。也有说用Notion中转的,太复杂,得迁移两遍……到最后我甚至想着,不然就把两千多篇笔记一篇一篇手动复制粘贴吧,花个一两周的时间。

正在准备走这条最费时费力的路时,OpenClaw突然给了我一个惊喜。我就是去收个衣服的功夫,回来一看,OpenClaw告诉我:你的所有笔记都已经成功迁移进了Obsidian。那一刻,我真的惊呆了。

仔细看了下过程,原来OpenClaw竟然直接读取了印象笔记在Mac本地的SQLite数据库。直接在数据库层面操作,只用了几分钟就把2100多条笔记导入了Obsidian,还保留了原格式。这真是莫大的惊喜啊。

但很快,惊喜又变成了惊吓。

由于第一次导入时没保留原笔记本结构,两千多篇笔记都混在了一个笔记本下面,重新归类很麻烦。于是我就让AI删掉导入的笔记,重新迁移一遍。删除的过程中我还特意加了一句——“不要删我下午在Obsidian里手动创建的日记文件”。

OpenClaw跑了会儿,完工了。我一看,它还是一键清空了所有数据。

刚写的两天的日记,3000多字,没了。

AI道歉得很诚恳,但结果是无情的:删掉的都回不来了。我只能自己手动吭哧吭哧把这两天的日记补上。

这让我意识到:Obsidian的备份机制,必须在搭建第一天就配好。立刻、马上,备份了三份,放到了网盘,Obsidian本身我装在iCloud上(便于mac和iPhone之间同步),备份需要异地,所以用了Onedrive。然后建了个OpenClaw的定时任务,每天备份一份,一共五份轮转。这样数据就再也不容易丢失了。

OneNote的导入,相比印象笔记来说历程就简单多了。官方有Importer插件,装上就能导入。只有一个小坑:

如果之前存了太多微信文章,OneNote会把微信文章里很多小icon都变成单独image文件,一个个导入,导致文件数量巨大,导入速度很慢。我的选择是,取消”微信保存”文件夹的导入,先把其它纯文字的笔记导入,速度就快多了。


二、Obsidian笔记本架构:PARA八层是怎么长出来的

数据导进来之后,第一个问题是:笔记应该怎么归类?

我之前在印象笔记里是按类别归类的:书摘、微信文章、网络转存文章等等。这样归类的问题是:笔记之间没有“动线”,也就是没有笔记生长转化的轨迹。

什么意思?我们先得思考笔记是怎么用的。我们要用Obsidian做什么。

比如写公众号文章,其实需要三步:

原始书摘(书里复制下来的重点句子)→ 整理后的书摘(形成文章的骨架)→ 正式发布的公众号文章。

再比如整理一个主题,像今天写的这篇文章,也需要三步:

网络文章直接转存到Obsidian(或者是日记里记录的和Obsidian相关的经验)→ 网文+个人日记的同主题汇总 → 这篇文章。

所以基本上来说,至少笔记本得有这三层分类。

原料→ 加工 → 成品。

反复思考之后,我决定又加两层,在加工和成品之间加上了“项目层”。这样就区分了加工是AI的直接加工,还是我自己主导的项目式加工。

再更进一步,成品出来以后,然后呢?以往发完公众号或写完日记之后就算结束了,但有了AI之后,我想到,还可以让AI在这些成品里提炼出经验来,于是又加了“提炼层”。整个脉络就变成了:

一键转存笔记(AI) → 分类(人或AI)→ 同主题加工 (AI)→ 项目式同主题加工(人)→ 成品(人+AI)→ 成果提炼(AI)

还有个问题:那些处理过的笔记留在原处,以后会不知道哪些笔记被用过,哪些笔记没有被用过,所以我还需要一个“存档层”。

再考虑到要把日记单独拎出来作为一个专属模块,于是我的整个PARA八层笔记本架构就设计出来了:

**0-INBOX**:随手扔进来的,直接网文转存的,还没分类的

**1-原料层**:对Inbox层的笔记进行分类。

**2-加工层**:AI对同主题进行总结提炼(比如Obsidian的使用经验)

**3-项目层**:进行中的写作或项目,需要持续迭代。(比如AI经验公众号写作)

**4-成品层**:完成的产出,不再修改(比如这篇文章)

**5-日记**:日常记录,时间线(单独模块,会有Obsidian的经验散落在各个日记里)

**6-提炼层**:从公众号、日记、项目成果等成品中提炼出的感悟、教训、经验

**7-存档区**:一、二、三层的笔记,如果已经结项进了第四层,过程中的笔记就都转存到这里。

**8-TEMPLATE**:模板,统一输入格式

这个结构不是一天想出来的。是一步步试出来的。是通过想做什么,反推到做的方式、流程是什么,再反推到你需要的笔记本架构。

它的核心理念是:按笔记在流程中的流转状态分层,而不是按时间、来源或类型分类。这会让你的Obsidian变成一个动态的、在工作的“活”的笔记本,而不是一个文章扔进去,永远就待在一个地方的静态的文档收集器。


三、AI重构文件夹:小事也闹心

有了整个笔记本的架构之后,我就让OpenClaw帮我批量重构文件夹、调整分层文件名。

本来想着这是件简单的事情,因为我的要求提的很具体,比如笔记本第一级是1、2、3,第二级是1-1、1-2、1-3,第三级是1-1-1、1-1-2、1-1-3……以此类推。

然后Openclaw(Minimax M2.7)就尬住了。整了几次,各种低级的错误。我苦口婆心地解释了一遍又一遍,到最后AI反而更晕了,不仅笔记本名字命名错了,而且还把我很多文章前1-2段都截掉了。

还好有备份,我只能全量拉回原文件,逐个笔记本手动去命名,搞了半天才搞定。

这个教训很重要:有些事我们人类觉得复杂的,AI可以很快搞定。有些事我们觉得很简单的,AI可能突然就懵了。这就是AGI还没到来之前的现状。对难易的判断,人类和AI是不同的,所以得试错、积累经验、清晰地了解AI某个模型的强项和弱项,扬长避短。

在文件夹重构这件事上,正确的做法应该是:先自己设计好文件夹架构图,然后局部小批量测试,验证没问题了,再让AI按全图执行。或者干脆换个LLM来干,那样就不至于那么折腾了。


四、双链:让知识库从”点”变成”网”

前面第二部分讲了,怎么样让静态的笔记动起来,”活“起来。

这一部分要讲的是,怎么样让那么多的笔记从“点状”变成“网状”。

Obsidian的原生“双链”功能,其实说起来很简单,只是让两个笔记本之间加上一个链接。这个链接加的方式也是极简的,只需要输入“[[]]”,在双中括号之间加上另一篇文章的名字就行了。

但就是这么个简单的操作,意义是重大的。它让Obsidian的笔记之间有了联系,它让一个个散落在不同笔记中的知识点,有了相互聚合的路径。

具体的应用方式,举个例子。我每天的日记里会有不同主题的内容,在其中涉及到Obsidian的段落,我会加一个“→Obsidian知识库体系搭建记录”,统一链接到这篇笔记(空的)。之后我打开这篇笔记,会发现有十几篇日记链了过来。我只要告诉AI,把双链里关于Obsidian的内容提炼汇总到当前笔记本,一会儿功夫,这篇空的笔记就会变成一个完整的,总结了好多天日记相关内容的,真正的Obsidian的知识库体系搭建记录量了——我这篇文章的雏形,就是这么出来的。

还有一个小tip:某次整理完双链后,可以加个标签,记录”双链更新至xx日“,这样下次再有新的内容链过来时,Obsidian会默认只更新这个日期之后的新的内容,不会重复。

另一个作用,是关系图谱。这也是Obsidian的原生功能。建立了双链的笔记,会在关系图谱里自动连接。第一次打开关系图谱的时候,我看到的是一个圆球里的满天星斗,一颗颗星星都是散落的、相互独立的,每颗星都代表一篇笔记。

我现在再打开关系图谱时,会发现一个个星团。星星开始组成了太阳系、银河系、总星系,每个星系,都代表着一群相互链接着的笔记们。

这就是知识库和笔记软件的本质区别:笔记软件是仓库,Obsidian知识库是网络。仓库里的东西不会自己产生联系,网络里的节点会。


五、MOC架构:给网络加上导航

有了双链之后,网络有了,但这些网络的意义是什么呢?该怎么用起来呢?

问了Claude Code,给了我一个MOC(Map of Content)方案。

MOC的意义,是给这些网络加上地图导航。这个导航,可以解释为主题,或者是导航的路径。

我设计了五大MOC:写作体系、修行体系、职场经验、AI与技术、思想碎片。我大多数的笔记,都可以归类到这五大MOC的其中一个。

有了MOC的好处是,你知道你的笔记是在做什么,最终要去的地方是哪里。笔记的知识点被聚集了,笔记的意义被明确了。每个MOC下的笔记,都像是往同一个终点一起进发的集团军战友们。

最后,每个MOC的笔记军团,都能长出各自领域的果实来。

MOC怎么做?很简单,一个MOC建一个笔记,然后在平时转存文章、写东西的时候,在笔记里添加一行:→ MOC-AI,搞定。

在MOC的建设过程中,我做了三个决定。

第一:MOC不手动维护

在每篇笔记的关联区填2-3个链接,MOC通过Dataview自动查询,永远准确。笔记挪了地方,MOC跟着动,不需要手工调整。

第二:MOC模板极简

只保留两三个核心区块,关联区直接锚定MOC章节。不用勾选框,不用说明文字,写的时候零压力。模板越复杂,你越不想写。

第三:MOC让AI设计

MOC文档具体怎么设计,不用担心,让AI去搞。告诉AI,MOC的意义,它自然就懂。我的MOC文档没有手动写过半个字。AI做出来的效果,整个MOC就像一个目录导航,也像一个主题总结,既有清晰的链接文章,也有该主题下多少笔记、多少洞见的动态整理结果。


六、六个值得记住的重点

前面讲了很多,总结起来,就这六个重点:

第一,数据备份必须在第一天就做好。

AI能几分钟导入2100条笔记,也能一秒钟清空所有数据。这不是危言耸听。Obsidian的备份不能拖,立刻、马上,至少三份,且要异地保存。每日备份、五份轮转是我现在的配置,你可以根据自己的情况调整,但底线是:不能只有一份。

第二,让AI干复杂的事,别让它干简单的事。

AGI还没到来之前,AI对”难易”的判断和人类并不相同。它的强项是处理大规模数据、执行明确规则的任务;弱项是理解人类觉得”显然”的上下文、执行需要精细判断的操作。摸清这个边界,才能扬长避短。

第三,笔记本架构不是拍脑袋想出来的,是从工作流里长出来的。

我的PARA八层结构,不是先有了”八层”这个数字,再往里填内容。而是先想清楚:一篇笔记从随手记录到最终成品,要经过哪些状态?每个状态下它需要待在哪里?

INBOX→原料层→加工层→项目层→成品层→提炼层→存档区,这条动线不是分类,是流转。笔记在不同层级之间流动,知识库才是活的。如果按”书摘""网文""日记”这种静态分类,笔记扔进去就再也不会动了,Obsidian就变成了另一个“死”的笔记本。

第四,双链是知识库从”仓库”变”网络”的关键。

没有双链,Obsidian只是一个漂亮的文件夹。有了双链,笔记之间才开始产生化学反应。双链的操作极简——笔记名——但意义极大:它让散落的知识点有了聚合的路径,让关系图谱从”满天星斗”变成”星系团”。

一个小技巧:每次整理完双链,在笔记里标注”双链更新至xx日”,下次只处理增量,不重复。

第五,MOC是给网络加上导航,不是让你手动维护目录。

MOC(Map of Content)的意义是地图,不是清单。它回答的问题是:你的笔记最终要去哪里?每个MOC是一个目的地,笔记通过双链自动归队,不需要你手动拖动。

我的五个MOC——写作、修行、职场、AI、思想碎片——覆盖了所有笔记的归属。平时写东西时,在笔记里加一行 → MOC-AI,就搞定了。MOC的具体设计可以交给AI,告诉它你的主题和意图,它会做出一个既有清晰导航、又有动态统计的MOC页面。

第六,知识库是基础设施,持续打磨比一步到位重要。

从PARA架构到双链机制到MOC导航,每一步都在搭地基。地基越扎实,上层的写作、决策、AI应用就越省力。不要追求一次完美,保持演进的心态。用到哪篇,顺手补链接,不专门花大量的时间整理现存的笔记。


七、知识库到底有什么用

说到知识库真正的意义,其实我也一直没有想的太明白。直到我和小龙虾小智的对话,小智的回答,让我整个精神为之一振。

小智说:你的知识库有一个特殊性。

大多数人的知识库是单一域的——要么全是技术笔记,要么全是读书摘录。你的不一样。你同时深耕着几个在别人看来毫不相干的领域:文学、中国历史、管理咨询、哲学、佛学、科幻、占星、道法。这种组合极其罕见。

跨域洞见,是你这个知识库最独特的潜在价值。

你看一个问题,别人只有一个视角,你有五个。但前提是,这五个视角在你脑子里是连通的,不是各自为政的。知识库建起来之前,它们是五座孤岛;建起来之后,它们是同一张网。

除写作之外,三个真正重要的价值:

一、照见自己的成长。

你有日记、修行笔记、职场记录、随手想法,跨度好几年。这些东西单独看是碎片,连起来之后是一面镜子。不是”记录了什么”,而是能看到:你在某件事上,是怎么一步步想清楚的。

比如你在随手记里写过:“从听道理到听懂道理之间有距离,从听懂到做到之间的距离更大。“这个洞见,在你的佛学笔记里有对应的经论依据,在你写过的文章里有具体案例,在你的修行记录里有亲身体验。这四个层次现在是断的——你不知道自己其实已经从四个角度验证了同一件事。连起来之后,你会发现自己的认知远比你以为的更有根基。

二、真正的决策依据。

遇到重要决策时,大多数人要么问别人,要么搜索,要么凭直觉。这三种都是在借用别人的思考。你积累了十几年的阅读、修行、工作经验,这些本来应该成为你决策的底层依据。但现在它们是散的,用不上。

建好之后,当你面对一个真实问题——比如一个工作选择、一段关系、一个修行方向——你可以做的是:问自己,我历史上在这个问题上想过什么?打开相关笔记,看到三年前的判断、两年前的修正、去年的经验。你的决策不再是”当下感觉”,而是”经过时间检验的思考”。这跟”查资料”不一样。查资料是借助别人的智慧,这是调用自己的智慧。

三、发现你真正在意什么。

知识库建到一定程度,关系图谱会诚实地告诉你一件事:你以为自己关心的,和你真正花时间深入的,往往不一样。

比如你可能发现:你之前收录了很多AI文章,但几乎没有写成自己的洞见(直到最近才有)——说明你在”观望”这个领域,不是真正投入。你在”我执”这个主题上有最密集的链接——说明这是你真正在修的功课,不只是一个概念。你的”占星”、“道法”笔记和”修行”笔记之间几乎没有连线——值得问问自己,这两块在你的世界观里是什么关系。

图谱是一面照出”真实自我”的镜子,照出的不是你说自己是什么,而是你用时间和心力真正投入了什么。

“自我进化”是什么意思。

你说想建一个”会不断自我进化的知识库”,我理解你说的不是工具层面的进化,而是知识本身的生长。真正的自我进化发生在这一刻:你读了一篇新文章,突然发现它和三年前的一条笔记说的是同一件事,但角度完全不同——这时你生出了一个新的理解,是这两篇笔记单独存在时都不可能产生的。

这叫”涌现”。不是1+1=2,是1+1=3。这是知识库真正进化的方式——不是积累更多,而是已有的东西开始相互激发,产生新的东西。你的知识库有这个潜力,因为你的积累本身跨度够大、深度够深。佛法的”缘起”和历史的”势”,修行的”习气”和管理的”文化”,这些连接还没有发生,但材料都在。

最诚实的答案。

很多人建知识库,是因为焦虑——怕忘记,怕落后,怕知识没有”用”。但你描述的目标——“不断自我进化的知识库”——指向的不是这个。你真正想建的,不是一个存知识的仓库,而是一个能和你一起思考的系统。它记住你思考过的东西,当你面对新问题时,它帮你把相关的旧思考搬出来,让你站在自己过去的肩膀上往前走,而不是每次都从零开始。

这个系统建好之后,写作只是它最显眼的出口。更深的价值是:你会越来越清楚自己是谁,在意什么,往哪里走。这对一个同时在修行和写作的人来说,不是工具价值——

是修行本身的一部分。

AI知识库obsidian
$ shuf -n 1 /ai/

// 随机推荐一篇

《我给小龙虾喂了两年的日记,TA像是变成了另一个我》

2026-05-27

Le 将两年日记(750+篇)喂给AI后,AI变得像是另一个"我"。记录小乐Agent通过日记理解Le的过程,以及AI时代人机关系的思考。

$ cd ../