-
2026 年,小而美 Markdown 编辑器,正在变成 AI Agent 的本地工作台

很久以前,Markdown 编辑器曾经很热闹
很长一段时间里,Markdown 编辑器这个品类似乎已经没有太多新故事了。
以前那些主打优雅写作体验的 Markdown 编辑器,很多早已淡出视野。有不少是 macOS 独占的,还有一些众筹之后因为交付和沟通问题引发争议的案例……现在回头看,很难想象一个 Markdown 编辑器在当年也能搞众筹。
如果现在只是写一篇文章,Typora 已经足够顺手。很久以前,每当我有新设备,总是会安装付费版的 Typora;后来转向了免费的 MarkText,也很出色,Typora 现在已经几乎消失在我的视野里了。

再后来,主角基本变成了笔记库。Obsidian 的崛起,已经带来了完整生态;如果要处理代码和相关文档,VS Code 也完全能胜任。于是很多人会觉得,新的 Markdown 工具是不是已经没有机会了?
但我最近连续看了一批新的 Markdown 工具之后,尤其是结合上次介绍的 Tolaria,我感觉有一个变化正在发生:新一代小而美 Markdown 编辑器,已经不只是为了「写 Markdown」而生,而是开始变成 AI Agent 可以直接接管的本地文本工作台。
也就是说,文件仍然是
.md,仍然在你的磁盘上,仍然可以用 Git、Syncthing、iCloud、Dropbox 或任何文件同步方式处理。编辑器旁边多了一层新能力:AI 可以搜索、总结、改写、整理、生成任务,甚至通过 MCP 直接读写同一个 vault。这和许多把内容上传到云端再调用 AI 进行加工的笔记产品,是两种完全不同的路线。
不要再只把它们看成 Typora 替代品
下面这几款新兴工具,如果按老眼光看,很容易被理解成「又一个 Typora」,但实际上并非如此。
Clearly 的定位很克制:打开一个
.md文件,写作,语法高亮,切换预览。它是 Mac 和 iPhone 原生应用,官网也直接写着 free and open source。我个人试了一下,的确很清爽,是 macOS 下的理想选择之一。(下图)
Cogito 则更接近「文件夹优先」的 Mac 原生笔记工具。它可以添加本地文件夹,支持
[[Wiki links]]、Obsidian 风格 embeds、任务勾选、PDF 导出,还内置 AI Chat,用来编辑和 review 文件。你也可以把它理解成一个更轻量级的 Obsidian。writer.computer 走的是另一条更加工程化的路。它基于 Tauri v2、React、CodeMirror 和 Rust,文档保存在磁盘上,尊重 workspace 的
.gitignore,支持多窗口,也能渲染表格和 Mermaid。速度快,整体是很务实的工程化风格。值得一提的是 Quarkdown。 这是另一个很有意思的产品。它不是普通编辑器,而是 Markdown-based typesetting system,可以通过
.doctype输出 papers、presentations、knowledge bases、static websites 等形态,并支持脚本化复用内容。如果想用 Markdown 生成更复杂、更正式的排版文档,Quarkdown 是个不错的发展方向。 (下图)
这些可以算是传统 Markdown 编辑器的升级版或后继者,但真正有意思的是另一批工具。
Markdown 开始变成 Agent 的操作界面
VMark、ZenNotes、SoloMD 这几款,已经不是简单地比谁的预览更漂亮,谁的主题更多。它们真正争夺的是:AI Agent 能不能安全、直接、可控地操作你的本地文本资料。之前介绍过的 Tolaria,也可以放在这个流派里。
VMark 自称它不只是 Markdown,而是一个 plain-text workspace,支持 Markdown、YAML、JSON、TOML、Mermaid、SVG、HTML、Code,并且通过 MCP 让 Claude、Codex、Gemini 直接读写同一批 artifact。
ZenNotes 的方向也很清楚:键盘优先、本地 Markdown vault、内置 MCP server、
zenCLI,并支持 Claude Code、Claude Desktop 和 Codex 直接编辑同一批磁盘上的 Markdown 文件。它还支持 Mac、Windows、Linux 桌面端,以及自部署 Web App。(下图)
SoloMD 野心很大,似乎想把自己做成一个包罗万象的 Markdown editor,同时也是连接 LLM 的桥。它强调 local-first、Git 分支管理、RAG embeddings、密码存储保护,当然也内置 MCP server,可以让 Claude Code、Codex、Cursor 直接驱动你的 vault;同时支持多个 BYOK AI 服务商。但我个人觉得它有点复杂,试用之后,不太有继续使用的动力。我更喜欢 Tolaria 那种风格。
几款工具如何选择
如果只是单篇 Markdown 文件编辑和管理,我不会把问题复杂化。Clearly 足够轻,Cogito 和 Writer 的使用体验也很舒服。现在正在用的 MarkText 也很不错。但至少对我来说,Typora 已经不会再作为首选了,时代确实变了。
如果你要做正式文档或长期笔记管理,Obsidian 仍旧是首选。想要接入 AI,Obsidian + Claude Code、Codex、OpenCode 等等,我之前有介绍,仍旧是不错的实践方式。
如果你关心前沿的 AI Agent 工作流,喜欢 All-in-one,那么前面提到的 VMark、ZenNotes、SoloMD、Tolaria,都是值得一看的产品。
Markdown 编辑器层出不穷,但 Markdown 本身并不是一种过时格式,而是成为了 AI 时代最容易被人和机器共同理解的本地数据层。
其它候选工具
Moraya:Tauri + WYSIWYG + AI Agent,方向和 SoloMD 接近,但还需要观察成熟度。
Otterly:像是更加轻量的 Obsidian / Cogito 路线,本地 vault 是重点。
Marko:Tauri、文件夹、Wiki links、Git,朴素但实用。
Inkwell:便携、离线、无账号,适合只想打开文件写作的人。
MerMark Editor:适合 Markdown + Mermaid 技术文档场景。
Nimbalyst:不算纯 Markdown 编辑器,更像 Claude Code / Codex 的可视化工作台,但代表了 Agent workspace 的趋势。
MarkEdit:不算新兴,但依然是 Mac 上小而美 Markdown 编辑器的稳定样本(下图)。

最后
我以前看 Markdown 工具,主要看:写作体验、预览效果、导出能力。
现在,基础功能早已被反复实现,「重新造的轮子」都可以绕地球几圈了。尤其是 AI Coding 使得各种廉价工具层出不穷,它们多半会被遗弃,但总会有精华保留下来。我会观察它们能否长期留下来的几个方面:安全和隐私保护如何?信息组织方式如何?能不能接入 MCP、CLI、Git、本地搜索?
这也是为什么我会说,2026 年的小而美 Markdown 编辑器,正在变成 AI Agent 的本地工作台。
最可靠的工作流未必是把一切交给云端,而是保留一组自己能打开、能同步、能备份、能审计,也能让 AI Agent 安全参与的本地文本文件。我一直是这个观点。
这也正是 Markdown 大放光彩的时刻。
文中提到的几款工具
https://cogito.md/
https://quarkdown.com/
https://clearly.md/
https://writer.computer/
https://zennotes.org/
https://vmark.app/
https://solomd.app/ -
Markdown已死? HTML才是未来? 这可能是个巨大的误解。

突如其来的唱衰
这周,突然一篇来自 Claude Code 内部人员 Thariq 的文章,在圈内大火。 引起了非常热烈的讨论。
这篇名为《Using Claude Code: The Unreasonable Effectiveness of HTML》的文章,大意是说,应该用 HTML 作为 人与AI交流的基本格式; 而不是目前广泛采用的 Markdown 格式。 原作者列出了一堆理由,也列举出了利弊。
但是在我看来,这篇唱衰 Markdown 的文章,并不是那么简单,复合了不少的误解。下面我会附原文的翻译摘要和我的观点一起进行讲解。
原文很长,但是翻来覆去就是几句话,大致核心是:AI 能力的提升,传统的 Markdown 格式已经成为限制,AI 代理(如 Claude Code)和人的交互应该全面转向 HTML,以获得更高的信息密度、更好的视觉体验和交互能力。。
原文摘要及我的的观点
1. 关于“信息密度与表现力”
原文观点引用:
“HTML 能传达比 Markdown 丰富得多的信息。它不仅能处理文本,还能通过 CSS 呈现设计、用 SVG 绘制插图。这完美替代了 Markdown 中低效且难看的 ASCII 字符画。”火箭君的观点:复杂不等于高效,内容与表现应该分离。
Markdown 的核心哲学正是「内容与表现分离」,它强迫 AI 和 用户专注于逻辑和文本本身。
让 AI 生成包含大量 HTML 标签、内联 CSS 和 SVG 路径的代码,会引入海量的无意义样板代码。此外,现代 Markdown 除了可以 完美的HTML 渲染以外,还可以通过集成 Mermaid 或 PlantUML 完美实现流程图和架构图。这种声明式的图表语法比臃肿的 HTML/SVG 源码更干净、更易于人类修改。
2. 关于“视觉清晰与易读性”
原文观点引用:
“超过 100 行的 Markdown 几乎没人愿意仔细看。而 HTML 可以通过标签页、折叠面板、响应式排版等视觉结构,将庞杂的系统设计或代码逻辑整理得井井有条。”
火箭君的观点:源码的可读性才是更重要的可读性。
HTML 只有被渲染后才易读,其纯文本源码(Raw Source)是完全反人类阅读的。而 Markdown 无论是否经过渲染,其纯文本本身就具备极强的结构化和可读性,这对于习惯在终端或代码编辑器中工作的知识工作者至关重要。无论是写文章还是写代码都是一样的,这是参与思考的过程。
当然,现在有种观点,人类未来不需要阅读源码,无论是写作,报告,还是 vibe coding, 源码都交给 AI 就好了。那我只能说,放弃读源码,实际是在外包自己的思考过程,等到大家都不再思考源码时,大家也就没有了自己的思考能力,只能看着 AI 生成的华丽输出傻笑了(目前已经明显有这个趋势了)。
3. 关于“分享体验”
原文观点引用:
“Markdown 在浏览器中缺乏原生渲染支持,往往需要作为附件发送。而 HTML 文件只需上传(如 S3)即可生成链接,同事们可以在任何设备上直接点开阅读,大大提高了分享效率。”火箭君的观点:增加了基础设施依赖与安全风险。
实际上,HTML 的分享门槛远高于 Markdown。分享稍微复杂一点的 HTML 需要专门的托管服务(如 AWS S3、Vercel 等),这不仅增加了基础设施成本,还带来了权限控制和数据泄露的安全风险。
相反,Markdown 是现代协作工具的“通用语言”。你可以直接将 Markdown 粘贴到 GitHub、GitLab、Notion 或 Slack 中,它们都会提供完美的原生渲染。不需要任何“上传文件并生成链接”的繁琐步骤。
我个人也介绍了很多 Markdown 编辑器(含渲染),Windows Notepad 也开始支持 MD 了, 这已经是一种默认的新文本文件格式了。 很难想象,2026年,一个严肃的知识工作者居然会打不开 Markdown 文件。
4. 关于“双向交互与自定义编辑器”
原文观点引用:
“HTML 支持双向交互。当文本框难以描述需求时,你可以让 AI 为你写一个‘一次性编辑器’(如拖拽式的工单看板、特性开关表单),调整满意后再将数据导出回 AI。”
火箭君的观点:过度工程化且充满安全隐患。
让 AI 编写带有 JavaScript 的“一次性交互界面”实在是过度工程化了。
首先,运行 AI 生成的未经审查的 JavaScript 代码可能导致 XSS 攻击或本地数据泄露。 原本只要好好的看文本,现在变成了还要运行代码。
其次,AI 生成的交互逻辑往往存在 瑕疵 Bug,难道还要为调试这些“一次性工具”,去花费的时间?直接用文本解决原问题,不是更好吗?我一直主张,关注内容,关注问题本身,而不是花哨的形式。 纯纯的 shi 上雕花。
5. 关于“生成速度与 Token 成本”
原文观点引用:
“虽然生成 HTML 通常比 Markdown 慢 2-4 倍,且消耗更多 Token,但在当前百万级上下文窗口下,这点消耗微乎其微,结果绝对物有所值。”火箭君的观点:稀释 用户 和 AI 两方的注意力。
姑且我们相信仅仅慢了2-4 倍。 抛开这些问题,因为AI算力,我假设以后一直会增长,一年后或许的确不是大问题了。
但在交互式 AI 体验中是灾难性的。哪怕慢2-4倍,等待几分钟只为了看一个排版花哨的报告,会严重打断用户的心流。
更重要的是,即使上下文窗口足够大,生成大量冗余的 HTML 标签也会严重稀释 AI 的注意力(Attention 机制),导致模型在长文本中迷失核心逻辑,增加产生幻觉的概率。同时,输出 Token 的成倍增加直接等同于 API 成本的激增。
而这一切,原本都是没有必要的。(哦,对了,你们是按 token 用量卖套餐的,这就解释得通了)
6. 关于审查和版本控制
原文观点引用:
“这是最大的缺点。HTML 的 Diff 噪音很大,确实不如 Markdown 容易审查。”火箭君的观点:无法进行审查,注定只能是玩具。
原文作者轻描淡写地承认了这一点。但是审查和版本管理,尤其是审查是不可避免的,如果我们讨论的是严肃的生产力的话。审查意味着有人参与的阅读理解,或者工具辅助的比较(比如 diff,但是多数情况下,非代码类的可能用不到 diff,但肉眼审查还是需要的)
不能被审查,意味着不能进入合规的企业用途,也很难成为效率生产的一部分(后续会带来混乱),只能在很浅的应用里打转,接近于轻娱乐和自嗨这类,我一直喜欢说的,这就是另一个“AI玩具”,闪闪发光,好玩,有新鲜感,然并卵,热度褪去后,什么也不是。
Claude Code 原本是一个真正的生产力工具,最后却要和一众 AI 玩具争夺市场?
最后
《HTML 超乎想象的有效性》一文确实展示了 AI 在前端生成方面的强大能力,HTML 也确实能做出好看的“演示工具” 或者 “AI玩具”,这是事实。

但是,Markdown 才是知识工作实践的基石。用 HTML 替代 Markdown 交互,本质上是为了追求视觉上的“华丽”,而牺牲了源码可读性、安全性、生态兼容性和审查控制能力。
在生产力的领域里,这不是专业的做法,也无疑是本末倒置的做法。无论 AI 以什么方式介入我们的工作,保持简单、专注内容,才是高效工作或协作的真正解法,这也是我这么多年的经验之谈。
顺便一说,Claude Code 借内部人士之口,鼓励大家用更耗 token 的方式使用 AI, 属于利益相反(COI),本身就有商业伦理上的可疑之处,值得我们注意。 (他原本完全可以说,给你们提供一个输出方式的选择 HTML,而不是说替代 Markdown )
Thariq 原文地址
-
【译】Obsidian 实际上是一个自定义的应用平台,而 AI Coding让每个人都能解锁它

写在前面
我突然意识到,Obsidian 之所以在一些用户中受到欢迎,是因为很多知识工作者的日常工作流,其实都可以简化为基于纯文本的记录。
不需要特别的专有程序。
如果各位需要画 CAD、剪视频、数学建模、电路设计……那可能就需要专门工具了。即使如此,仍旧有相当一部分工作流,只需要文本记录即可,比如协作沟通记录、文摘、脚本草稿、写作草稿……
我一直推崇 Obsidian 的 File over app 理念。简单的文件成了主角,双链引用和标签则成了连接信息的枢纽。而它真正的平台潜力,正来自这种可扩展性。
如果大家关注 Obsidian 这几年的发展,可能会产生一种感觉:且不说无数第三方插件,随着官方 Canvas、Bases 陆续推出,Obsidian 已经不再只是一个单纯的 Markdown 笔记工具,而更像是一套基于新理念的个人工作台。
它是一个开放平台。如果你想在 Obsidian 里加入一个自己的应用,完全可以通过插件的形式来实现。这是以前 MS Office 很难做到的事情。一定要做当然也可以,但非常复杂。
现在有了 AI,实现 Obsidian 插件的门槛就更低了。
最近我读到 TfTHacker 一篇文章。他是很有影响力的海外科技博主,文章里分享了自己为何以及如何构建一个基于 Obsidian 的自用西班牙语学习 App。
看到开头部分时,我立刻感到它和我之前的想法高度吻合,同时也提醒了我一些此前忽略的事情。于是,我毫不犹豫地决定翻译并分享给大家。
以下正文,火箭君翻译并略作编辑。原作者:TfTHacker,原文出自:https://tfthacker.com/
正文
我刚刚构建了一个完全可用的学习 App:抽认卡(Flashcards)、语音识别、临时刷题模式。
而且,我自己一行代码都没写。
它完全本地运行,没有服务器,没有数据库,也不需要托管费用。它能在我的电脑、手机和平板上运行,甚至任何人都可以安装。
听起来很神奇,其中的秘密是:我把这个 App 做成了一个 Obsidian 插件。
而我是通过和一个 AI 对话,完成了整个构建过程。
让我解释一下为什么这件事很重要。
我们共同的问题
也许每个人都有过一个关于工具的想法。
这个工具往往和自己的工作或学习方式密切相关。我们去应用商店寻找,却发现没有合适的。
我们有时也想自己构建它,但现实很快摆在面前:也许我不是开发者,所以不知道如何构建应用。即便我是开发者,也需要一台 Web 服务器、一个数据库、前端代码、后端代码、托管和部署。
为了一个可能只有自己会用的个人工具,付出这么多努力?
那就有点过头了。
于是,这个工具 App 的想法就在脑中夭折了。
和其他大多数想法一样。
Obsidian 里藏着一些东西

大多数人忽略了一点:Obsidian 不仅仅是一个 Markdown 编辑器。
它是一个完整的应用运行时。
Runtime,火箭君注:可以简单理解为一个程序运行所需要的环境。
在底层,Obsidian 是一个 Electron 应用。也就是说,它本质上是一个可以运行网页应用的完整浏览器环境。
它支持 HTML、CSS 和 JavaScript。这些也是驱动互联网大多数内容的基础技术。
这让它成了一块非常适合构建界面的灵活画布。
但它还不止于此。
Obsidian 还悄悄提供了每个应用都需要的三样东西。
存储
我们的 vault 就是数据库。
数据保存在你自己拥有的本地文件中。不需要 SQL,不需要云端配置,也不需要第三方依赖。
同步
如果你使用 Obsidian Sync、iCloud 或类似服务,你的数据本来就已经可以在设备之间同步。
你的应用可以直接继承这一点。
分发
我们构建的一切,都可以以 Obsidian 插件的形式存在。
插件有一条明确的分发路径:你可以通过 BRAT 私密分享,也可以提交到 Obsidian 的社区插件目录。
界面、存储、同步、分发。
这四件事组合在一起,就是一个完整的应用平台。
而它其实一直就在那里。
AI Coding 改变了谁能构建软件
通过与 AI 代理对话来构建软件。
描述你想要的东西,让 AI 编写代码。
像 OpenAI Codex 和 Claude Code 这样的工具,已经让这件事变得可行。

关键转变在于:我们需要的核心技能不再只是编程,而是清晰表达。
我们能描述 App 应该做什么吗?我们能测试它,并用语言解释哪里出问题了吗?
如果能,我们就能构建软件。
我们是产品经理,AI 就是开发者。
现在,我们把这些点连起来。
AI 编码降低了亲自编写代码的必要性。Obsidian 降低了对服务器、数据库和部署基础设施的依赖。
二者结合,创造了一种新的可能性:一个个人应用平台。任何愿意描述自己想要什么,并持续迭代直到可用的人,都可以尝试构建属于自己的工具。
我亲自测试过,下面是整个过程。
我构建了一个西班牙语数字学习插件
我在学西班牙语。
根据以往的语言学习经验,我知道,掌握数字是基础。
我需要一个非常具体的工具:用于识别书面数字的抽认卡、用于强化训练的突击模式,以及用于通过听力识别数字的听力练习功能。
现有工具都无法按我需要的方式,同时满足这三点。
我需要一个专门为我打造的应用。
于是,我在屏幕一侧打开 AI 代理,另一侧打开 Obsidian。
我告诉 AI,我正在构建一个 Obsidian 插件,并让它参考正确的 Obsidian 文档,包括示例插件、开发指南、发布规范和 CLI 参考。
它读完这些内容后,很快理清了方向。
然后,我们一起制定规格说明。
我描述每个功能:抽认卡流程、突击模式逻辑、数据存储、视觉布局。
AI 代理会在对话过程中,把规格说明整理出来。
接下来就是一个循环:
AI 生成代码,我把它放进 Obsidian 里测试。
我会告诉它:
「这个按钮应该放在这里。」
「数据在不同会话之间没有保存下来。」
「突击模式需要提高答错数字的出现权重。」
AI 会进行修改。
如此反复继续。
当它能在电脑、手机和平板上运行时,我让 AI 代理把项目整理成可以发布到 GitHub 的状态,包括 README、许可证、发布配置和完整的打包步骤。
最后,我把它发布了。
其他用户可以通过 BRAT 安装。
在这个过程中,我从未直接接触过代码。
整个应用都是通过对话构建出来的。

接下来,说些真实感受
我不会夸大其词。
实际上,过程中遇到的问题大致如下。
引导一个 AI 代理,本身就是一项真正的工作
你可以把它当成一个聪明但缺乏经验的合作者来管理。
它能产出惊人的成果,但它不会读心术。
你要提供方向,发现错误,并在它偏离时纠正路线。
规格说明是最难的部分
在任何代码编写之前,你必须深入思考自己真正想要什么。
功能是什么?流程是什么?边界情况是什么?
AI 代理可以帮助制定规格,但主导者仍然是你。
AI 开发速度更快,但并不是瞬间完成
我的西班牙语数字插件,是一个相对聚焦的应用。
即便如此,它也花了大约一天半。
如果手动编写代码,可能要花我一周左右。
这确实是显著提速,但别指望能在一小时内,把一个想法直接变成成品。
测试能发现 AI 漏掉的问题
我的插件在为某些数字类型生成西班牙语时出错。
这可能会让用户学到错误内容。
我不得不添加额外验证,并推动 AI 代理写出更好的测试。
AI 捕捉不到所有 bug。
我必须自己对质量负责。
发布过程仍然有些技术性
我需要阅读文档,并理解 Obsidian 插件分发系统的基本概念。
这不一定需要亲自编写代码,但确实需要获取相关背景信息。
我希望 Obsidian 未来能进一步简化这一过程。
谁应该尝试这个?
对于希望根据自己的工作流精确定制工具的个人用户来说,这种 AI Coding 方法很理想。
对于通过共享 vault 或共享文件夹来同步插件和数据的小团队来说,这种方法同样适用。
它并不是为复杂后端、大规模多用户应用而设计的。
但如果是个人工具、小团队实用程序和定制工作流呢?
它确实打开了一种新的可能性。
更大的图景
我们正处于一个转折点。
AI 大幅降低了构建软件的门槛,但软件仍然需要一个运行和承载的地方。
它需要界面、存储、同步,以及分发给用户的方式。
Obsidian 提供了所有这些。悄无声息。没有喧嚣。它一直就是一个应用平台。
想一想,大家希望存在的那个工具。
那个完全符合你需求、完全匹配你工作流的工具,可能一直不存在。
而且,应用商店里往往也找不到它。
现在再想想,构建它的门槛从未如此之低。
几乎不需要学习编程。不需要搭建服务器。
你只需要描述自己想要什么,并愿意不断迭代,直到它真正可用。
平台已经在那里,AI 也已经足够可用。
剩下的问题是:你是否真的知道自己想要一个什么工具,并愿意把它一点点打磨出来。
原文作者(TfTGancker)制作西班牙语学习 App 的 Github repo:
-
Tolaria, 一款结合 Obsidian 和 Notion 优势,又是本地,又是开源的笔记工具新品诞生了!

Tolaria,这款工具很新,也挺火。
如果你看过或者用过它,很难不被它吸引。且不论它能走多远,在大家以为 PKM 已经没什么新花样的年代,Tolaria 这样一个真正的后来者,能做到如此出色,确实让人感叹。
什么叫做后发优势?
经常读我文章的各位,想必已经对 Notion / Obsidian 之类的知识管理工具耳熟能详了,各种优劣点也能如数家珍。
先说 Notion。它的界面和操作足够友好,也有原生 AI 集成;但它锁定云端,没有本地优先的数据主权,也很难给用户留下自由折腾的空间。
再说 Obsidian。它插件众多,适合折腾,本地优先,数据自主;但云同步相对孱弱,协作也基本不要想了,AI 集成目前也仍在推进中。
还有一些 PKM 工具也各有特色,有的引入了 Type「类型」的概念,我个人很喜欢;有的则主打短平快,而且开源。
到了 2026 年,在 AI Coding 的加持下,少数人也终于可以打造出大家心目中的 PKM 工具,而且功能上几乎没有妥协。这个站在后发者角度出现的产品,就是 Tolaria。
和 Notion 相比,它有类似的 / 命令和文档模块,编辑界面也有相似之处;但 Tolaria 更像是一个本地优先的 Notion。
和 Obsidian 相比,它也有双向链接、纯本地 Markdown 文件和 YAML 支持;但 Tolaria 更像是一个开源取向的 Obsidian 替代品。
其实还不止这些。我只是想说,Tolaria 这个后来者非常熟悉它的前辈们,并且有针对性地找到了各自的差异点。这不像是一个笔记爱好者吹牛的作品,也不像是什么知识管理体系卖课的套路,反倒像是真正懂行的人出手做出来的结果。它虽然后发,却有一种集大成作品的气质。
Tolaria 登场

这款产品的常规特性我就不再介绍了,有常见笔记工具经验的用户肯定上手就会用。什么模块化笔记、双向链接、Markdown 语法……它基本都支持。

我就讲讲几个给我留下深刻印象的地方。
Obsidian File Over App 理念的继承者
在 Tolaria 里,没有黑盒数据库,没有云端同步的强制绑定。每一个笔记,就是一个干干净净的 .md 文本文件。
这意味着哪怕明天 Tolaria 这个软件彻底从地球上消失,我们的知识库依然完好无损。你可以用系统自带的文本编辑器打开它,我们的数据永远只属于我们自己。
这是 Obsidian 的核心理念之一,Tolaria 也是这一理念的继承者。这意味着 Obsidian 和 Tolaria 之间几乎没有太大隔阂,迁移和共存的成本都比较低,用户的选择空间和安全感也都得到了明显提升。
Git 成了内置标配
大多数笔记软件都有个「回收站」,但 Tolaria 没有。它直接把整个笔记库「Vault」变成了一个 Git 仓库。每一次修改和删除,都会在底层版本控制里留下痕迹。
对于非技术人员来说,这可能是噩梦,太极客了。但熟悉这种设定的用户,会获得一种前所未有的安全感:永远可以回滚到某个历史版本,再也不用担心误删或者改废了一篇长文。
看到那些 Diff 视图,我估计有人会感动到要哭。其实 Obsidian 也是可以集成 Git 插件的,只不过,在 Tolaria 里,Git 是内置标配。

引入了 Type 和视图
如果说上面两点只是技术选型上的偏好,那么 Tolaria 对「分类与标签」的处理,则展现了相当不错的产品判断。
用过 Notion 的人都知道,它的核心是 Schema「模式」。要建一个表格,往往需要先定义字段:这个是文本,那个是日期,另一个是单选框。这种「结构先行」的设计,导致很多人在记笔记前,要先花半小时搭框架。
Tolaria 提出了一个截然相反的理念:Types as lenses「类型作为透镜,而不是强制结构」。
在 Tolaria 里,你可以给笔记打上各种「类型」,比如 Project、Topic、Journal,并为它们设置不同的颜色和图标。但重点是:这些类型并不会强制你填写某些字段,也不会进行严格的字段验证。
它们只是帮助你在这个庞大的文本库里导航的「视觉提示」。你想填属性就填,不想填就空着;你想给这篇随笔标个红色的灵感图标就标,不想标,它就是一个普通的文档。
当我们需要汇总或查询特定类型、特定条件的文档时,可以创建一个筛选或查询视图,并保存下来供以后复用。
这种理念在其他笔记工具里也有体现。比如 Obsidian 其实也可以通过笔记关联、标签和查询视图达到类似效果,我也一直是这样做的。Tolaria 只是把它显式地表现了出来,并作为内置标配。
更独立的 AI 集成方式
过去一两年,几乎所有的笔记软件都在疯狂加 AI 功能:右键帮你总结、帮你润色、帮你扩写。
多数厂商出于商业目的,都希望用户使用 PKM 工具内置的 AI,并把它作为订阅收费的一部分。这其实和提供云存储一样,属于锁定基础设施并收费。各类云笔记几乎都是这样做的,这是重要的收入来源。
Obsidian 显然不会走这条路,所以它更像是在摸索一种独立于 App 自身的 AI 集成方式。用户可以选择与 Claude、ChatGPT 或其他 AI 客户端结合使用,Obsidian 只提供接口。这和 Obsidian 的一贯理念是吻合的。
Tolaria 本质上还是 Obsidian 的精神继承者,保留了用户对 AI 的独立选择。只要用户装过 Codex 或 Claude Code,就可以一键连接,开箱即用。至少在这一点上,它似乎走在了 Obsidian 前面。
Tolaria 内置了一个完整的 MCP「Model Context Protocol」服务器。通过 MCP,AI 可以直接读取整个笔记库,理解目录结构,甚至直接在里面新建文件、修改内容。

我们可以对 AI 说:「把过去一周我写的关于『管理学』的散碎笔记,整理成一篇结构化的长文,并更新到我的主页目录里。」
Tolaria 不做自己的封闭 AI,而是把自己变成了一个对所有外部 AI 极度友好的「容器」。这种 AI-first 但不 AI-only 的策略,也就是优先拥抱 AI,但不把用户锁死在某个 AI 服务里,确实聪明。
无论未来是 OpenAI 还是 Anthropic 出了更强的模型,Tolaria 的用户都可以持续接入更前沿的 AI 能力,而不必被绑定在某个软件的订阅费上。
最后
我已经简单试用了一会儿 Tolaria,但这个产品还很新,更新也很频繁。我建议大家先不要冲动迁移整个知识库,观察一段时间后,再做结论。原因如下:
(1)目前还存在不少小 bug,我都忍不住想提交修改了。
(2)AI 集成还需要更稳固的支持。这已经不是单纯挂一个 MCP 就能解决的问题,还需要更多真实使用场景的打磨。
(3)目前支持 Mac,好像也支持 Linux,但我还没试过;不过现在竟然还没有 Windows 版本。(这种 Tauri 项目居然还要挑挑拣拣……)
总体来说,Tolaria 潜力很高,作者一看就是懂行的人,非常清楚现有笔记产品的优劣点。
问题是,Tolaria 还太新,缺少时间积累,也没有插件生态支持。它看起来很像 AI Coding 或 Vibe Coding 加速下的产物,后续维护和修整仍有待考验。
但它的开源特性,又让这些问题有了被解决的可能。只要人气足够高,就可能有贡献者持续维护下去。再加上 AI Coding 的发展,这些问题也许并没有过去那么难解决。
所以,它现在最缺的,其实就是时间。
有兴趣的小伙伴可以立刻去试试看。不用注册账号,也不会让你月付、年付去订阅什么 AI 套餐。(AI 工具得自备,也就是 BYO。)
再强调一遍,Tolaria 不是一款 AI 套壳骗订阅的闪亮新鲜产品,它更像是 Obsidian 精神上的继承者。
Tolaria 官网地址
-
让 AI 帮我们画流图,我试了几种 Excalidraw MCP 方案

很久以前,我介绍过一些在线流程图工具,当时有很多人都表现出极大的兴趣。如今转眼已经到了 2026 年,在 AI 大行其道的当下,我突然发现,已经出现了可以几乎完全依赖 AI 来绘制流程图的方案。
只要把要求交代给 AI,它就能先把图画出来,后面我再细调或修改,效率比以前手工绘制高了不少。
首先还是要讲一下 Excalidraw。它是一个流行的开源绘图工具,不过这并不是今天的重点。这个工具已经出现很久了,很多软件都围绕它做了集成或插件支持,比如 VSCode、Obsidian,甚至它的官网在线版也是开箱即用。

顺便一说,Excalidraw 插件比 Obsidian 官方的 Canvas 还要早,直到今天仍然位居插件下载排行前几名。开源也意味着它更容易被 AI 接入和操作。
所以,今天真正要讲的重点还是 AI。毕竟,不管是 Excalidraw,还是其他那些画面更精致、功能更丰富的流程图工具,选择其实很多。但 AI 集成是另一回事。
这里我更看重的是智能化体验。和 AI 说话,直接出图,不用关心具体工具细节,也不用研究各种操作技巧。我们可以把自己想象成一个管理者,只负责把需求讲清楚,剩下的事情交给操作员去完成。至于操作员用什么工具、怎么画,那反而不是重点。
开始之前,先准备好 AI 客户端
在开始之前,我们得先准备好 AI 客户端。这虽然不是本期画图的重点,但几乎是之后所有 AI 协作的前提之一。
我们以前介绍 Obsidian Skills 时,也是一样需要 AI 客户端。当时我印象里用的是 Goose,这次我试了试 Codex。

除了 Codex,我们也可以用 Claude Code、OpenCode、Goose 等等。可选择的 AI 模型也各不相同,这个就按大家的喜好来选即可。就我自己的判断看,AI 客户端这一层很难拉开长期差距,最终大多会趋同,你有的功能我也会有,而且迭代速度都很快。
Excalidraw 官方 MCP
Excalidraw.com 官方也下场做了 MCP,走的是 MCP Apps,也就是交互式界面这条路线。它更像一个带交互界面的 MCP 应用,可以在聊天窗口里直接生成 HTML 交互界面。
设置也很简单。告诉 AI 客户端,我要使用
github.com/excalidraw/excalidraw-mcp,帮我把它封装成一个 Skill,以后我就可以通过 Skill 远程调用这个官方 MCP。AI 会自动查询文档并完成 Skill 设置。不同客户端的操作方式可能略有不同,但核心机制是一样的。需要注意的是,这个官方开源 MCP 既可以自部署,也可以远程调用。我们这次主要试了试远程调用,后面也会讲到另一个偏本地自部署的方案。
AI 设置完毕之后,后面就可以直接通过 Skill 要求它出图了。
比如,我这里的使用方式就是这样。

AI 在完成思考并调用 MCP 之后,就会生成这样的图。我们可以直接在 Excalidraw 官网打开,再进行编辑、保存和导出。

从我的理解看,Excalidraw.com 官方的思路,可能就是通过 MCP 把用户引导到 Excalidraw 网站上。这个网站本身就是个在线工具,免费开箱即用,甚至可以把本地文件直接拖进去立刻编辑。如果有更重度、更高频的需求,包括更紧密的 AI 集成,以及云端分享和协作,官网也会进一步把我们引导到 Excalidraw+ 的付费订阅方案上。
就我的实际使用感受来说,官方 MCP 的整体表现算是中规中矩,速度也比较一般,而且最后还是要回到网页里打开。当然,你也可以把 MCP 自行部署到本地或自己的服务器上。总体来说,这更适合轻量、临时的使用场景。如果你本来就有比较重度的画图需求,那我反而会建议直接订阅 Excalidraw+ ( 7美金每月 )。
@cmd8/excalidraw-mcp:一个纯本地的 Excalidraw MCP
如果你和我一样,更偏向本地优先,那我会更推荐
@cmd8/excalidraw-mcp这款开源 MCP。它不是最花哨的,但它很可控。这是目前最贴合我工作流的方案。它的路线相当克制,从安装那一刻起,它就要求你指定一个明确的本地路径。它暴露给 AI 的能力也很克制,比如创建节点、创建连线、删除元素、读取整张图的状态等等。
这意味着我们不需要开网页,也不用经过 Excalidraw 官网。你只需要像平时让 AI 改代码一样,把需求甚至修改意见直接交给它,AI 就会去修改本地那个
.excalidraw文件。

因为它本质上就是本地文件,所以很适合直接纳入版本管理,方便审阅和提交。这一下就把整条工具链打通了。查看绘图文件需要我们自己安装一个可以打开的工具,比方说,我这里是 VSCode 加 Excalidraw 插件,或者其它的什么兼容的 App 都可以。对于 Codex 这类本就擅长处理本地工程文件的 AI 客户端来说,这种方案确实非常顺手。
同样,初始设置也不复杂。我们只要告诉 AI,要封装一个 Skill,基于
@cmd8/excalidraw-mcp这个开源项目来生成图,剩下的基本就交给 AI 去处理即可。其它选择
除了上面两个 Excalidraw 相关的 MCP 之外,其实还有一些别的路线。
比如
yctimlin/mcp_excalidraw,这是一套更「重」的实时白板工作台。它需要在本地同时跑两个进程,一个是本地网页上的 Canvas server,另一个是 MCP server。它提供了几十个工具,支持元素级的增删改查、场景描述,甚至截图导出。但对我来说,这条路线就有点太重了。如果我真的有这种需求,我大概率会选择某种本地专业工具来完成操作,让 AI 先给个草稿,再回到专业工具里编辑,但是长远来看,未来的 AI 或许真的可以事无巨细的全包下来。
另外,还有一个不属于 Excalidraw 体系的替代选择。那就是:如果我们本身就是 Obsidian 的重度用户,那我上次介绍的 Obsidian Skills,其实已经包含了对 Obsidian Canvas 的操作能力,也能画出流程图,而且能更好地和 Obsidian 笔记引用结合,整体上也更轻量。
唯一的遗憾是,Canvas 和 Excalidraw 毕竟是两套不同的体系。Obsidian Canvas 只属于 Obsidian,而 Excalidraw 的生态基础更广,在各种软件里也更容易找到现成的集成和兼容支持。
最后:AI 应用风暴,才刚刚开始
如果只是想最快看到效果,或者想给团队做个酷炫一点的演示,那就选官方方案,体验在聊天窗口里直接出图的感觉。
如果想要一个能反复打磨细节的画图助理,那可以去折腾
yctimlin的实时画布方案。如果想要 All-in-Obsidian,那就继续用 Obsidian Skills 去制作 Canvas。虽然不是 Excalidraw,但在 Obsidian 工作流里依然很好用。
而如果和我一样,只是想在 Codex 这类客户端里,把架构图当成本地资源的一部分来管理,那我会更推荐
@cmd8/excalidraw-mcp。至于 MCP 或 Skill 的未来,也许真的会像官方方案暗示的那样,把聊天客户端逐步变成一个个真正的应用容器。这件事很值得期待,因为它很可能会让不少套壳式 AI 产品或轻量工具,开始显得没有那么必要。
AI 生成流程图、架构图、关系图这些能力,可能还只是个开始。更大范围应用形态变化的「风暴」,恐怕已经在路上了。
-
【速报】硬核的「在线大纲笔记」 Tana,现在要彻底转型了,不知是福是祸

Tana 最近的动作有点大。如果我们对它的印象还停留在那个硬核的「在线大纲 + 知识图谱」工具,现在得刷新一下认知了。
根据大约一周多前(3月31日)的官方公告,原来的 Tana 产品 将正式更名为「Tana Outliner」;而「Tana」这个主品牌,则被拿去承载一个全新的、主打团队协作和 AI 代理(Agent)的产品。
全新的 Tana 官网首页已经直接挂出了新产品的口号:「Meetings that ship」,并开放了早期访问申请。
这已经不是什么常规的加强迭代了,新产品应该是另一个截然不同的生产力工具了。
新旧 Tana
Tana 的官方坦诚:Tana 的老产品(现在叫做 Outliner 了,下图)确实强大,但学习曲线太陡,一些小众用着爽,但想在团队里推广简直是灾难。面对这个情况,他们没有选择把老产品强行「降智」推向大众,而是直接分家。所以,大家不要期待 Tana Outliner 什么开箱即用,什么任务引导上手,什么视频教程 …… Tana Outliner 和以前一样高冷。(我甚至怀疑就是放弃了,想想 Arc)

那些喜欢折腾无限缩进和 Supertags 的硬核笔记玩家,继续用保留下来的 Tana Outliner;与此同时,Tana 官方另起炉灶,做了一个门槛更低、专攻下一代 AI 协作流的新 Tana。
新 Tana 的野心不在于「帮我们记住会议」,毕竟会议记录的 AI 产品 太多甚至泛滥了,新 Tana 想做的是「开会时就把活干完」。看看口号 Meetings that ship,有点感觉了吧。
新 Tana 想要在开会的同时,把决策、bug、行动项直接塞进 知识图谱,甚至顺手生成 PR、产品说明或用户旅程图。它自带视频会议体验,未来还计划接入 Zoom 和 Teams 这类 现有会议工具。很明显,Tana 想把自己变成一个以会议为入口、AI Agent 为执行层的协作中枢。
从放出的功能清单看,新架构确实是冲着真正的大众市场去的:实时协作画布、细粒度权限、更像传统文档的编辑器,外加 GitHub、Slack、Linear 等一堆外部 App 接入,甚至一开始就考虑了移动端。
相比之下,以前的老 Tana 太像小众硬核玩家自娱自乐的系统了,非常不适合直接改成团队平台。这点,我个人也完全理解,以前的Tana 我也不知道怎样向一般人普及 ,门槛太高了, 潜在用户最好先有一些普通笔记工具的经验,然后理解大纲笔记结构,需要思路逻辑严谨,对标签的本质,信息的聚合,数据的查询…… 最好都有理解,这已经不是一般用户了,妥妥的 power user。
老用户手里的 Tana Outliner 会被抛弃吗?
至少官方目前的态度是安抚。2026Q2 的更新计划里依然排着 API 修复、桌面端优化、分组能力和移动端改进。更远的路线图里甚至还有本地 AI 模型和日历同步。

但我心里还是有点不安,官方虽然承诺了不强制迁移、争取夏天前做出一键迁移、现有订阅不变;可是,最致命的几个问题——具体时间线、新定价模型、双产品数据怎么打通——目前还完全难以预测。
这也是为什么我自己一直用的是 LogSeq(Tana 实际上最初很像 LogSeq的在线版),我很推崇 Tana 的一些设计,尤其是 Supertag,但是当我一看到在线云端,我就知道如果没有协作需求,我是不会采用Tana 作为主力工具的。因为,我也担心,将来 哪天 Tana 不玩了,数据和功能都完全受限于人。 再仔细想到:这类大纲图谱工具,其复杂的数据结构还不是 Markdown文本可以简单导出的,这简直是个专有数据库啊,所以迁移成本必然很高,与其到时割爱,不如以终为始。
最后
把复杂硬核工具拆分,商业上是步好棋。纯个人知识管理(PKM)离钱太远,大家当做强身健体的爱好就行了(对个人还是非常非常有用的),而商业上,想靠 PKM 挣大钱的几乎没有。另一方面,如果不是面向个人,而是面向组织和生产力团队的 知识管理是有利可图的,但目前也在受到各种花式 AI 方案的强力打压。
可以肯定的是,目前关于协作和执行的费用,仍旧是企业预算中重要的组成部分。Tana 描述这个新方向无可厚非。考虑到 Tana 背后已知的两轮融资,转型几乎是不可避免的。原有的小众 PKM 故事,根本撑不起这个上亿美元估值的叙事。
话说回来,如果各位现在就是 Tana的 付费用户,建议很简单:先别慌,接着用 Tana Outliner。密切关注新 Tana 的定价和迁移方案即可。
至于,这次新 Tana 的重构能不能成,让我们拭目以待,不出几个月里面就会有分晓。考虑到现在 AI 热点高速演进,一个季度里面不出点成果的话,也就不用混了,要么 ChatGPT, Claude 自己已经实现了; 要么海量第三方创业公司 通过 Vibe Coding 也实现了;最最不济,如果这个点子真的有用,在稍微晚些时候,各大会议工具例如 Zoom,项目管理工具 例如 Linear 也都会跟进实现。
所以说,留给 Tana 的时间其实不多了。Tana 团队赶紧开会,如果你们的新 Tana 真的像你们说的那样神奇,快点用你们自己的新工具,把自己的新产品自动交付出来吧。
-
在 Obsidian 里,笔记标题是如此重要,写得越笼统,思考的价值越低

回想一下,也许几年前,我们刚建好第一个 Obsidian Vault 的那个周末。
我们可能花了好几个小时折腾文件夹分类,挑了各种社区主题,装上了当时排名第一的 Dataview,晚些还会装上 Excalidraw,看板,日历,任务插件;然后对着那个空白的全局关系图谱(Graph View)发了一会儿呆,幻想它迟早有一天会变成什么复杂的的「第二大脑」图谱,炫酷的知识花园 ……。
一切准备就绪后,写了几篇不明所以的笔记后,我们早晚会郑重地敲下第一对双中括号
[[ ]]。我们该引用或创建什么东西?202403 播客随想?《掌控习惯》第二章读书笔记?关于创造力的几个点子?
不用多久,当我们在快捷切换(Ctrl+O / Cmd+O)的搜索框里敲下“创造力”,看着跳出来的几十个毫无关联、面目模糊的搜索结果时,会感慨这到底都是些什么?
再看看我们的关系图谱,它根本不是什么「大脑神经网络」,这个比喻我一度觉得害了很多人,我相信大脑绝不是这样运作的;而且,也不是画个酷炫的图谱就掌握了知识连接的精髓。
经历这几年后,我可以很有把握的说,其实所有一切混乱的根源就在最开始,给笔记命名 这件事情上。
为什么在 Obsidian 里,标题就是一切?
在早期传统的笔记软件里,大家靠「树状目录」找东西,这也是更早期文件系统的映射。但我们知道在 Obsidian 里,核心玩法是双向链接,这是一等公民,但不是说传统分类不重要。
无论是双链,文件夹,还是标签……, 我们在笔记之间的关联,仍旧和笔记标题有极高的联系。 两年后,当迫切需要某个观点来支撑一篇文章时,大概率能让我们和那条旧笔记重聚的,就是它的标题恰好命中了我们大脑中自然浮现的那个搜索词。

我们不可能,在未来去深读每一篇文章,所有搜索关联,能浮现在我们脑海里的都变成了:简短的标题,关键词(也可以说:标签)。
这是我们的肉身大脑在处理复杂信息时,自发的一种信息压缩,为自己建立一个短索引表。 我觉得这个短索引表更接近于我们掌握的知识,而不是那些花里胡哨的「第二大脑」。
标题的误区
如果上手不考虑一下标题,会直接导致了我们在建构 Vault 时遇到这样的麻烦。以下是我自己一路踩坑后的一些感悟。
误区1:用信息来源命名,而不是用观点
这是一种虚假的安全感。我们觉得自己在追踪信息源,很有条理。但「来源」只是收集那一刻,某一种维度的分类方式。尤其是到了现在,2026年了,Obsidian的插件,还有 AI已经足够发达,这些来源信息,很多时候都在收集的刹那被自动写入文件 meta 里了。 标题上重复的意义就不大了;除非这个来源特别有意义,否则可以选择性忽略。
误区 2:使用笼统模糊的词汇
像
[[关于记忆的想法]]或者[[习惯的思考]],这些根本不是标题,只是占位符。当 Vault 里只有 50 篇笔记时这招管用;当有 500 篇笔记时,这就没什么用了。 因为只能命中:「记忆」,「思考」,「习惯」 这样的泛泛之词,没有更深度的见解,引用时,完全不知道是不是命中,除非再去读一遍原笔记,这样的话效率就非常低下了。 标题的优势在于第一时间决定了什么要读,什么不要读。
正确的命名可能是:
[[在长期记忆保留上,自我测试的效果优于重复阅读]]。而且充分利用,Obsidian 的特性,多写一些「原子笔记」,千万不要把一大堆内容扔在一起,然后起一个笼统的标题(我以前常这样做,所以真的是深有体会)。
误区 3:用「问题」代替「答案」
[[什么是反脆弱?]]或者[[复利到底是怎么工作的?]]用问题做标题看起来很有趣,但有趣没法帮我们建立有效的连接。
「问题」不是知识,「问题」只是待研究队列中的一个入口。
如果这是我们要准备去阅读去调研的空白笔记,这是一个不错的命名,但是如果作为一个归档的笔记,我会觉得欠妥。如果真的思考过了,就直接写结论:
[[反脆弱系统能从波动性中获益,而不仅仅是坚韧]]。这是一句完整的论点。它可以被反驳,可以被其它笔记扩展讨论。如果目前还不知道答案,那这条笔记就不该成为归档笔记,它应该待在收件箱或者类似 Todo 的队列里。
根据我上面的理论,如果能写出这个结论标题,是因为我们自己努力过了,进行了信息压缩,使之进入第一大脑中的「短索引表」了。
误区 4:滥用 Zettelkasten ID
很多刚接触卡片盒笔记法的人,崇拜卢曼卡片笔记法,喜欢给每条笔记加上时间戳,比如
[[202403281423-刻意练习]]。 我们知道,Obsidian 的确有这样的核心插件。卢曼当年使用数字编号,是因为他用的是实体卡片和木头盒子,需要编号来确定物理位置。而我们用的是 Obsidian,拥有毫秒级的笔记搜索。

在数字软件里,时间戳可以作为 YAML 区的元数据(Metadata)保留,但最好不要让它占据标题的视觉重心。除非,时间特性很重要,比如时事新闻类。
如果要加前缀防止重名,至少要确保时间戳后面跟着的是一句完整的观点,而不是空白或一个干瘪的词汇。
误区 5:过度依赖剪藏插件
这个就是老生常谈了,数字囤积不是知识,囤积再多也没有用。
通常的场景是:我们用 Obsidian 网页插件,Readwise 或者 Omnivore 把一篇文章的高亮直接同步进了 Obsidian。系统自动用文章原名生成了标题,把几十条划线文本塞进页面。看着排版精美的页面,我们心满意足地关掉窗口。

笔记是建好了,但 真正的思考并没有发生。我们只是把互联网上的信息搬运到了自己的硬盘上。如果为了检索,还不如不要保存,以后需要时去 搜Google 或者 问AI。
解决办法是插件收藏的东西,不要进知识库,我现在收藏的东西都是单开一个 Vault 。我很清楚里面的东西全都是「阅后即焚」不会保留下来,即使长期不读吃灰也会定期彻底删除。 这些收藏的东西,如果真的有价值,我会转换成有个有结论的标题,存入知识库,而且还不是全文文保存,只提取要点,这就是知识蒸馏(distill)。 有了自己的标题,就有了自己的思考。
可是,这会不会太难了?
当真的去尝试这种「论点式」命名法时,我们就会发现一个残酷的事实:Vault 里一半以上的笔记,可能根本提炼不出论点。
而且,每次脑子里冒出一个小火花,都要打开 Obsidian,等那几十个插件加载完,再绞尽脑汁去想一个完美的标题……这种巨大的摩擦力,会让很多人陷入完美主义瘫痪,最后干脆什么都不记了。
如果大家也卡在了这里,我建议的解法极其简单粗暴:别在 Obsidian 里完成所有流程的事。
就像我收藏专门在另一个地方,写在另一个地方,Obsidian 知识库就是一个归档库。 一个东西有了价值,有过自己的思考再放进 Obsidian,这时很容易给出一个标题。把「收集」和「思考」在物理层面上拆开。
最后
所有这一切,看似在说笔记标题,我想说的重点在于「思考」。
- 收集的目的是为了给思考提供素材,不是为了囤积。收集时,很有可能起不出标题。
- 分类的目的,是为了决定思考的顺序,层级和结构。不要把单一分类信息作为标题。
- 蒸馏的目的,就是为了思考出结果,这时应该有标题了。
- 输出观点的目的,其实是思考成果的复习和再组织,应该会有更好的标题。
一切 AI 总结,高级搜索,或者未来科技如何发展, 笔记的作用始终在于强化我们的第一大脑。任何让我们放弃思考的技术,或者代替我们思考的所谓「第二大脑」,都是非常危险的。
而检验或加深思考的最好办法,从命名笔记标题开始。我们可以立刻从现有的 Obsidian 笔记库开始逐条看看,能不能给出一个好标题。
-
【译】为什么我们解雇了 Jira 和 Slack。

写在前面
无意冒犯,我知道 Jira 和 Slack 有很多拥护者。 所以,我今天选择介绍的译文,提到了「解雇 Jira 和 Slack」 其实也不是针对这两种特定的工具。我只是看到了一些不同的观点,在不同的领域下,工具和用法的选择实际上是某种「工作文化」的显现。事实上,如果要说差劲管理,哪怕用 Excel + 邮件 也能把人逼死。
关于如何更有效的协作,如何发挥团队成员的「自主性」,我觉得可以写一本书出来。 但是, 我想重点表达的是:对于很多需要创造力的工作,不应该把协作变成流程崇拜,也不应该把沟通交流变成实时的焦虑。 这固然不是工具自身的问题,而是管理者选择工具和用法的问题。 当做出了一种工具选择,其实就固定了一种工作文化。工具反映了一种意志,是面向监工管理者,还是面向真正的生产者?是提升监管力,还是提升了生产力? 很遗憾的是,决定工具选择的人,往往不是生产者,而是管理者。
我个人始终觉得,对于那些有固定套路,需要僵硬流程束缚,需要实时响应的事情,应该逐渐让给 AI 或 程序 去完成。 人不应该是机器里的齿轮。
今天要介绍的文章 来自 https://medium.com/@mattlar.jari/we-fired-jira-and-slack-8febdc0a5843;原作者:Jari Mattlar;火箭君翻译并略作编辑。
以下正文。
正文
工具不仅仅是组织工作的手段。它们还在构建行为模式。
三个月前,我做了两个高管团队认为微不足道的决定:用 Linear 取代 Jira,用 Float 替换 Slack。“只是工具而已,”我们的首席技术官说。“请把注意力放在大事上——战略、愿景、招聘。”
他错了。那些“微小”的改动,比起两年间的高管离线会、核心价值观研讨会和团队建设静修,总共对我们公司文化的变化影响更大。
没人会告诉你这一点:工具选择就是你团队文化的一部分。不是你的使命宣言。不是你的全员大会演讲。团队每天使用的那些软件,比任何备忘录或喊任何口号都更能塑造人们的行为。
而且大多数公司在无意中正在建立一种混乱、分心和表面化工作的文化——但他们自己却毫无察觉。

对你公司的隐形税:与工作有关的工作
知识工作者把 60%的时间花在“与工作有关的工作”上——沟通任务、寻找文档、管理不断变化的优先级——而不是他们受雇来做的那种有技术含量、具战略性的工作。
想一想,也许每10个小时里就有6个小时要用在一些破事上。
美国员工专门用于“有关工作的工作”的时间占比为 61%,并且他们认为如果流程改进,每周可以节省整整一个工作日。这不是生产力问题。这是一个伪装成人员问题的工具问题。
残酷的算术:如果你支付一位高级工程师 15 万的年薪,你实际得到的是 6 万的工程产出。剩下的 9 万呢?都被 Slack 漩涡、Jira 考古学和日程拼图给吞没了。
为什么你的“最佳实践”工具正在扼杀文化
Jira是官僚机器?
我们最初采用 Jira 是因为我们认为“那才是真正的工程团队该用的东西”。但六个月内,发生了以下情况:复杂螺旋:搭建项目变得如此复杂,我们还专门雇了一个人,整天的工作就是“Jira 管理员”。当你的工具需要一个全职的祭司阶层来解释时,你建立的不是一个系统,而是一种宗教。(火箭君注:太贴切了!)
信任崩溃:Jira 那些复杂的工作流传递出一个信息:我们不信任你去管理自己的工作。每个工单都需要审批。每个估时都要验证。每次状态变更都要给出理由。需要大量自定义和复杂层级的团队会选择 Jira——但代价是陡峭的学习曲线以及对小团队而言令人不堪重负的功能。
创新之死:初级工程师不再提出创意,因为为探索创建一个 Jira 工单感觉像是在傻傻地填表。提供摩擦不是一个功能——它是创新文化的杀手。
这个工具并没有在组织工作。它是在制度化一种不信任。

Slack是始终在线的焦虑机器?
典型的 Slack 用户每天登录 9 小时,但主动使用只有 90 分钟。换句话说:7.5 小时的背景焦虑,担心自己错过了什么紧急事项。
感到必须在下班后继续工作的员工,其生产力评分比在标准工作日结束时下线的员工低 20%。然而 Slack 的绿点制造了“在线监狱”——持续不断的压力,迫使人们看起来在线、回应及时、随时可用。
真正的损害?加州大学欧文分校的研究显示,开发者在被打断后平均需要 23 分钟才能重建专注力。记住是:每一次提示。
做个算术:6 次 Slack 打断 = 损失 138 分钟。那几乎是你工作日的一半,用来爬回被人问“快速问一下?”之前的状态。
用户在工作时间平均每天在 Slack 上花费 90 分钟,平台每天发送的消息超过 15 亿条。这不是生产力。这是大型表演——没有实质内容的工作幻象。

Linear:速度即信任
我们改用了 Linear,然后发生了出乎意料的事:工单开始更快地被关闭。并不是因为大家更努力了,而是因为这个工具不再与他们作对。
Linear 的加载速度大约是 Jira 的一半,并且提供了大量键盘快捷键,所以团队在更少挫败感的情况下工作得更快。但速度并不是最大的收获。
真正的胜利是文化上的。Linear 的极简设计传达出一个信息:我们信任你去做好你的工作。没有强制性的 14 项字段表单。没有工作流审批链。没有将注意力引导错位的 sprint 表盘。(火箭君注:这是敏捷管理术语)
使用 Linear 的团队表示他们“非常喜欢使用它”并为它代言,而 Jira 用户通常会回答“还行吧,我想”。这种情感上的差异很重要。当工程师喜欢他们的工具时,这表明领导层尊重他们的时间。
一位工程师告诉我:“Linear 感觉像是由会写代码的工程师打造的。Jira 感觉像是由监督别人写代码的管理者打造的。”
Float:以深度工作为默认
Float 的独到之处不在于功能,而在于理念。它没有把每条信息都当作紧急事项处理,而是将沟通按主题分成不同的收件箱:顾客紧急事件、团队更新、仅供参考。
这一改变带来了巨大的文化涟漪:
专注的许可:工程师可以在指定时间批量处理信息,而不是一直处于被动应对模式。半数办公桌工作者表示他们很少或从不休息,但 Float 的设计让休息成为默认而非例外。
设计即异步:当紧急信息放在单独的收件箱时,紧迫性偏差消失了。团队开始撰写更好、更周到的信息,因为他们知道回复不会是即时的。
不再演示“出勤”:没有了持续不断的绿色状态点,文化从“看起来很忙”转向“把事情做完”。只有 18%的人报告说自己一半时间内都不怎么高产,但平均员工有 60%的时间花在与工作相关的事务上——Float 直接针对这一差距。
数据不会说谎:工具塑造结果
全球员工敬业度在 2024 年降至 21%,生产力损失使全球经济损失达 4380 亿美元。这不是动机问题。这可能是由不合适的工具引发的疲惫问题。
95%的公司表示技术问题影响了生产力水平,包括软件滞后、连接性差以及登录困难。但“技术问题”其实是技术行话,意思是“我们的工具让工作更难,而不是更容易”。
在协作型组织工作的员工感觉自己更有准备应对挑战的可能性高出 79%——是那些不太协作的组织的四倍。但协作并不是拥有 Slack,而是拥有能够支持有意协作而非持续打扰的工具。
一些统计
在使用 Linear 和 Float 90 天后:
- 平均拉取请求周期时间:下降了 34%
- “每周专注工作小时数”:从 8 小时增至 14 小时
- 下班后消息数:下降 67%
- 员工参与度评分:上升 28 分
- 自愿离职率:零(之前按年化计算为 23%)
但最重要的指标是:当我们对团队进行调查时,73%的人表示,工具的更换比过去两年里任何领导层的举措都更改变了我们的文化。
不是我们的新带薪休假政策。不是我们的远程优先规定。也不是我们修订后的薪酬结构。
只是更换了工具。
这比你想象的更重要的原因
大多数公司把文化当成一种软技能来对待——价值观海报贴在墙上、什么欢乐时光、分享宠物照片的 Slack 频道。但文化体现在那些工具每天强制执行一千次的微观行为中。
每次 Jira 为一个简单的错误强制填写十个字段时,它都在说:“我们不信任你的判断。”
每次 Slack 在晚上八点打扰你时,它都在说:“你的个人界限不重要。”
每次你从深入工作切换去回答‘有空吗?’时,它都在说:“被打断是常态,学会忍受吧。”
平均每位每周参加 21 小时会议的开发者,因上下文切换给公司带来的平均损失每年达 5 万美元。那不是夸张——那就是注意力碎片化的代价。
令人不舒服的真相
你无法通过研讨会把文化变好。也无法靠使命宣言做到这一点。
文化是你团队工具为你做出的无数微小选择的累积。而大多数工具的优化目标是管理的可见性,而不是创造者的生产力。
Jira 给管理者仪表盘。Linear 给工程师速度。
Slack 给管理者在线状态指示。Float 给工程师专注的权限。问题不是哪个工具功能更好,而是哪个工具更契合你想建立的文化。
下一步该做什么
如果你是创始人、工程主管或产品经理,看到这篇文章时,也许在想“是不是我们的问题出在工具上?”,不妨试试下面这些统计:
- 做一次「打断」统计:记录你的团队每天被打扰的次数。乘以 23 分钟。这就是你们每天的上下文切换成本。
- 匿名调查你的团队:“这个 [具体的工具名] 是帮助你发挥最佳工作状态,还是在制造关于工作的额外工作?”答案会让人大开眼界。
- 选一个工具来替换:从小处着手。我们先用了 Linear,然后是 Float。不要贪多求全。但也别把工具更换当成小事。它们其实是伪装下的文化改写。
- 衡量行为,而不是采用率:别追踪“使用新工具的百分比”。追踪“深度工作小时数”、“下班后消息数”、“关闭工单所需时间”。文化通过行为体现。
你选择的工具并非中立。它们每天都在为你想要的文化投票——或者为你不得不忍受的混乱投票。
残酷的事实?公司文化不是在你的手册里定义的。它在下午 3:47 显现——当一名工程师收到第 6 条 Slack 通知,不得不第 6 次重建 23 分钟的上下文时。
选择尊重专注的工具。否则就继续困惑于为什么你的“企业文化”从未奏效。
-
【速报】Chrome 最新的 3 个加强功能,终于开始认真整理浏览器工作台了

Chrome 2026 的一些新的发展方向
最近十年浏览器上的新功能层出不穷。单独作为产品的新概念浏览器也不少,从早期的分屏浏览器到现在最新的AI浏览器 ,从小众的 Opera Neon,Sigma OS 到后来一度大火的 Arc,现在的 Dia,Comet,Atlas …… 想必各位也没有少见。
但是,一直掌握市场份额的还是 Chrome, 在这点上,Chrome 的做法像苹果的风格,等各位折腾得差不多了,它官方出一个集成功能,然后就结束了。比方说,一度大火的 浏览器AI插件,甚至 AI 浏览器,现在 Google 将 Gemini 内置于浏览器中,随时打开侧边栏就能处理。注意 Gemini,需要谷歌账号为 英语美国地区,英语首选语言,以及各种魔法设置,不是本文重点。
我今天介绍的 不是 Gemini in Chrome,而是几个大家可以立刻用得上的,而且非常实用的更新功能。这波 Chrome 更新,难得有点「回到工作台」的味道。Google 官方在 2026 年 2 月公开强调了桌面端的生产力增强,试着把浏览器重新整理成一个更像工作界面的地方。
下面我们逐个来介绍。
Vertical Tabs:把标签页从顶部救出来
先说最有「形式感」的那个。 这里感谢 沉浸式翻译 Owen 的提醒,此功能我以前只知道是 Beta 版功能,其实最近已经加入了最新的正式版(但是仍旧需要手工开关设置)
Vertical Tabs,也就是「垂直标签页」;一个Windows用户,如果使用自带 Edge 浏览器的话,对垂直标签页一定不会陌生。 这个功能一度成为 Edge 与其它浏览器区别的标志,甚至有人为了这个特性改投 Edge, 其实非 Windows 环境 也是有 Edge 的。

「垂直标签页」本质就是把传统的顶部标签栏搬到侧边,改成纵向列表。这个变化听起来不大,但标签页一多就会立刻有感觉。顶部标签栏的问题很简单,一旦标签页超过十几个,标题几乎都会被压缩到只剩图标。换成纵向排列后,网页标题能显示得更完整,和标签组配合起来也会清楚很多。
它最适合的场景,其实就是重度浏览器用户的日常。比如查资料时同时开着文档、搜索结果、后台、笔记页;比如写文章时一边参考多个来源,一边还挂着素材站和管理后台;再比如开发者一边看文档,一边看调试页和仓库。过去这类工作流最大的问题不是没有工具,而是标签页太快失控。
Vertical Tabs 的价值,就在于让标签重新变得「可读」。尤其是在我个人喜欢的桌面大屏幕环境,特别是宽屏显示器上,拿一点横向空间换更清晰的组织结构,往往是划算的。
Vertical Tabs 开启方法也很直接,只是目前还不算完全公开。更新到 Chrome v146 正式版(之前是 145 beta 就有了)然后打开
chrome://flags/#vertical-tabs把实验开关设为 Enabled,重启浏览器后再到Settings > Appearance,把Tab strip position从Top改成Side。
Split View:终于不用在两个页面之间来回切换
如果说 Vertical Tabs 是解决「过多」的问题,那 Split View 处理的就是「同时看」的问题。
Split View (分屏浏览)它允许我们在同一个 Chrome 窗口里并排显示两个网页。官方给出的用途:比较信息、参考不同来源、复制粘贴内容,以及同时处理不同网页任务。原本需要两个窗口排列、或者反复切标签页才能完成的动作,直接在浏览器内部视图中就可以完成了。

「分屏」这个功能,熟悉火箭君的读者应该已经至少看到我在不同产品里面强推无数次了。很多场景会用到。比如:写作和笔记,左边看资料,右边写稿或者整理提纲。对比和筛选,比如并排放两个商品页、两个文档版本、两组数据来源。边看边做,左边教程、右边后台,或者左边会议记录、右边任务系统。Chrome 直到现在才把它做成原生功能。
开启方法已经很成熟。可以右键当前标签页,把它加入新的 Split view;也可以右键某个链接,直接选择在 Split view 中打开;还可以把标签页或链接拖到窗口左边或右边来触发。
桌面端快捷键也已经有了,Windows 和 Linux 是
Shift + Alt + N,Mac 是Cmd + Option + N。进入分屏后,还能交换左右位置、单独关闭其中一侧,或者把它拆回普通标签页。Chrome 甚至允许把 Split view 图标固定到工具栏,后面直接一键调用。对大多数人来说,这会是这 3 个功能里最容易立刻用起来的一个。我个人建议,Chrome 可以考虑再增加一个 click 快捷键,就像 CTRL+ click, Shift+click 一样,专门用于拆分屏幕打开链接。
PDF annotations:把文档动作留在浏览器里
PDF annotations 处理的是浏览器里的文档动作,也就是让 Chrome 内置 PDF 查看器不仅能看,还能直接画、标、签、记。
浏览器一般都是 PDF 阅读器,这点本来没有什么好说的,但是早期仅限于阅读,后来 Edge 把 PDF 注释高亮和简单编辑 也加入浏览器之后,大家发现既然一样都要打开阅读了,浏览器完全可以胜任一个轻量的 PDF 标注编辑工具。
我个人之前都是拿 Edge 作为 默认 PDF 浏览器的,现在开始考虑转向 Chrome了。
Chrome 官方页已经明确写道,Chrome 现在可以在 PDF 上高亮、批注、绘制,也能填写和签署表单,还支持做个人笔记。绝大多数时候,我们对 PDF 的需求并不复杂,无非就是划重点、做标记、签个名、改一改表单。以前为了做这些小动作,总得下载到本地,再扔进另一个软件里处理。

更值得一提的是,Chrome 对扫描型 PDF 还加入了 OCR 处理。官方说明里提到,这类 PDF 会在设备本地自动转换成可搜索、可选择的文本,之后就能高亮、复制、查找,而且整个转换过程可以在本地完成,不会把数据发给 Google 或第三方。
使用方式也不难。直接在 Chrome 里打开 PDF,在查看器顶部选择
Draw,右侧会出现工具面板,可以选 pen 或 highlighter 来绘制和标注;完成后下载时还能选择保留修改内容。要是希望 PDF 默认在 Chrome 中打开,而不是每次都先下载,可以到chrome://settings/content/pdfDocuments里调整。还有,Google 也是有点小心思的, 编辑完的 PDF 可以一键转存到 自己的 Google Drive 上,属于Google生态圈互相加成了。
最后
把这 3 个功能放在一起看,这次 Chrome 的思路其实很清楚。(注意,以上都在当前最新版Chrome中 v146测试通过)。
- Vertical tabs 处理的是标签组织
- Split view 处理的是并行浏览
- PDF annotations 处理的是浏览器里的文档动作
它们组合起来,确实在认真整理浏览器工作台,让桌面端成为一个生产力工作界面。仔细想想,上述功能的场景都是在足够繁琐复杂的任务下才会出现,甚至对屏幕都有要求,桌面端环境最适合了。
应该说,上面说的这些功能都是呼声很高的生产力方向,不像浏览器自定义酷炫颜色换肤,或者什么都要 AI 集成那种「赶时髦」类型,属于朴素但实用的功能。希望大家如果真正需要生产力,能够用得上。
-
【译】不要纠结于DOCX、PDF、Markdown、HTML …… 我只以一种格式制作文档

写在前面
如今许多 Markdown 编辑器都标配了多格式导出功能,其底层核心往往离不开 Pandoc 的支持。长久以来,我对 Pandoc 仅停留在概念层面的了解。直到近期阅读了一篇深度分享,作者讲述了如何通过 Pandoc 与 Org 模式构建「单一格式笔记库」,从而彻底摆脱排版与格式的束缚,这让我对其背后的工作流产生了浓厚兴趣。
采用单一纯文本格式(如 :Markdown)的核心优势,不仅在于创作时能屏蔽排版干扰、专注内容本身,更在于其极低的数据解析门槛。纯文本天然具备极佳的机器可读性,这意味着在 AI 时代,AI Agent 可以无缝接入并处理这些笔记。
这正是纯文本笔记面向未来的核心竞争力。云端笔记的智能化受限于平台生态,封闭或复杂的混合格式则存在巨大的数据转换摩擦;而纯文本(Markdown, Org, YAML, LaTeX 甚至 JSON)则完全规避了这些痛点,是真正的 AI-Ready 资产。
在这样的工作流中,Pandoc 扮演了不可或缺的「桥梁」角色。它补齐了纯文本生态的最后一块短板,打破了单一格式与复杂应用场景(如出版、分发、打印、网页渲染等)之间的转换壁垒,让内容创作与最终呈现形成清晰的「工具链」分工。
原作者:Joe Riad; 原文地址:
https://medium.com/gitconnected/i-only-make-documents-in-one-format-8b50bd61972d
火箭君翻译,并略做编辑。
正文
我一直讨厌和同学/同事一起处理共享文档。总会有人因为使用的 Word 版本略有不同,或者干脆用了另一套办公软件,结果在自己的电脑上出问题。我们也可以共享 PDF,但不容易编辑。
假设我们对共同的文档格式达成了一致,那那些期望我把网页发布到共享服务器上的人怎么办?我是否必须把 Word 文档的信息重复一遍以 HTML 格式呈现?虽然有导出服务,但还是很麻烦。
简而言之,在对文档有不同假设和不同使用场景的人之间共享文档,很容易变成一场噩梦。这就是为什么当我发现有一个可以为我处理所有这些工作的自由软件工具时,我感到震惊。更重要的是,它让我只需撰写一次文档,就能根据需要将其发布为多种不同的格式。
我要介绍的是 Pandoc 。它几乎可以在你能想到的任意两种文档格式之间进行转换。将内容与格式分离
在我谈论 Pandoc 之前,我想介绍一下我不久前接触到的文档设计概念。这种思路影响了我在 Pandoc 中制作文档的方法。这个想法很简单:文档的内容应该与其格式相互独立。在处理文档时,应当先填写内容,之后再考虑格式。如果我们只编辑过 Office Word 文档,这个概念可能会让人感到很陌生。
在 Word(或 LibreOffice Writer 或类似软件)中编辑文档时,通常在输入内容的同时编辑格式。我们会关注字体大小、颜色、哪些内容加粗、哪些不加粗、标题如何格式化等……如果更有经验一些,可以使用文本样式。例如,可以指定所有标题应为加粗、14 磅并使用某种字体,而普通文本应为 12 磅并使用另一种字体。
这样在创作内容时我们就不必纠结于格式的细枝末节了。这是将格式与内容分离的第一步。Word 仍然可能具有干扰性,因为你在输入时就能看到最终文档的大致样子,所以你会更容易对格式问题敏感并产生分心。
我第一次真正接触到这个概念是在大学开始用 LaTeX 写学术论文的时候。在 LaTeX 中,我们在输入时看不到最终文档的样子(不过,也可以参见 LyX)。
我们只需指定内容和结构元素(例如:这是一级标题、这是列表中的一项等……),LaTeX 引擎会将你的指令编译成最终文档。它使用预定义的样式完成排版,能以很小的成本让文档看起来相当专业。
当然问题是,与不太懂 LaTeX 的人协作处理 LaTeX 文档相当困难。最终文档是 DVI 或 PDF 格式,也不容易编辑。
有一段时间,我只能在个人写作中采用这种文档设计方式。任何需要与他人分享的东西都必须是 Word 文档,用惯了 LaTeX 之后,Word 这种方式让我感到相当沮丧。
我的理想情况是用一种标记语言(比如 Markdown)来指定文档的内容和结构,然后让一个引擎将其格式化为我所需的文档类型。 Pandoc 正是提供了这一点,这也是我第一次接触它时,会觉得它带来了一种范式转变的原因。。
关于 Pandoc
Pandoc 几乎可以在我听过的任何两种文档格式之间进行转换。我认为,如果格式不是 Pandoc 能处理的那些之一,那么它大概非常小众,用户自己应该已经是这种格式的专家了,并且能够把它转换为其他格式。为了高效实现这一点, Pandoc 将任何文档格式转换为一个通用的内部表示(中间码),然后再把该内部表示翻译为目标格式。这样,与其为每一对可能的格式编写转换器,不如只需为每种格式实现与内部表示之间的翻译器。
这种能力的妙处在于,它允许你用一种格式来撰写文档,并根据需要使用相同的源文档发布为多种不同的格式。关键是选择一种表达力足够强的格式。当我刚开始使用 Pandoc 时,我认为 Markdown 非常适合这个目的。
下面是一个包含不同结构和格式元素的 Markdown 文档的小示例:
要将此文件(假设名为 mydoc.md )转换为 docx 格式,我可以在命令行中这样做:
pandoc -f markdown -t docx -o output_file_name.docx mydoc.md
其中 -f 指定 源格式, -t 指定 目标格式。下面是该文档在我的 LibreOffice Writer 中的渲染效果:

由于 Markdown 允许我指定标题级别, Pandoc 会识别文档结构并在 docx 文件中使用标题样式进行复现。因此一级标题使用「Heading 1」样式,二级标题使用「Heading 2」样式。这意味着,例如,如果我想要的话,可以很容易地生成目录。
但乐趣并未止步于此。我可以使用相同的 Markdown 源文档来创建一个 HTML 文档:pandoc -f markdown -t html -o mydoc.html mydoc.md
得到如下结果:

当然,这只是普通的 HTML。通过指定一个 CSS 文件可以让它变得更好。下面是一个示例 CSS 文件。如果我将其保存为 pandoc.css 并以这种方式转换我的文件:
pandoc f markdown -t html -o mydoc.html mydoc.md--css=pandoc.css --standalone
同理,我也可以将相同的文档转换为 PDF,或其它格式。
即使像方程式这样的专业支持也非常棒。如果转换为 HTML,我们可以使用 MathJax 让它们以类 LaTeX 的质量渲染。如果转换为 PDF,它们会通过 LaTeX 渲染;如果转换为 docx、odt、pptx 等格式,它们则会被转换为本地的、可编辑的方程式。我们在 Markdown 中输入方程时,仍然使用 LaTeX 语法。
也可以通过 YAML 向文档添加元数据:
可以通过过滤器进一步扩展功能,你甚至可以使用 Lua 为自己的文档格式编写自定义转换器(关于这点,请参见 Pandoc 网站)。长期以来,这一直为我带来极大帮助,但我总觉得 Markdown 在表达能力上相当有限。这就引出了我今天实际使用的文档格式。
Org 与 Pandoc 导出
当我遇到 Markdown 的局限时,我也刚开始接触 Emacs。Emacs 里有一个名为 Org 的模式,它本身就是一套效率很高的生产力工具。在其众多功能中,它有一种用于指定文档结构的标记语言。
当我调出 Org 导出对话框时,看到的是:
类型非常丰富,我很难想到我可能需要使用却找不到的格式。当然,如果找不到,Org 也允许我编写自定义导出器。大家可能会认为我在从 Markdown 切换到 Org 时遇到了问题。因为我已经有很多用 Markdown 写的笔记和文档,需要花时间将它们转换为 Org。
事实证明这根本不是问题: Pandoc 当然可以将 Markdown 转换为 Org!
有时,我希望 Pandoc 的功能比现有的稍微强大一些。这时我发现了过滤器。基本上可以拦截 Pandoc 所理解的文档内部结构,并在导出前对其进行修改。
Pandoc 过滤器
正如此处详细解释的, Pandoc 首先将文档转换为它可以以 JSON 格式输出的抽象语法树(AST)。筛选机制允许你编写自己的代码来拦截此 JSON,对其进行修改,然后输出供 Pandoc 完成将其转换为目标格式的剩余工作。
Pandoc 的创建者创建了 pandocfilters Python 包以便于这一过程(https://pypi.org/project/pandocfilters/)。
大家也可以使用过滤器来预处理引文和参考文献(这就是我最初的用例),将实时获取的数据(例如股票行情)注入到文档中,或使用几乎任何只要 Python 能做到的方式来转换文档。
我自己的例子
以下是以 Org 为核心采用这种创作流程后,我获得的一些具体收益:
我用 Org 写完了整篇博士论文,并通过 LaTeX 导出成 PDF。这是一个巨大的工程,涉及自定义 LaTeX 样式文件和参考文献样式等……最棒的是,我不用处理 LaTeX 的样板内容就能发布高质量的 LaTeX 文档。到了准备答辩幻灯片的时候,我使用了 LaTeX Beamer。我能够毫无阻碍地将论文 Org 文件中的内容直接复制到演示文稿的 Org 文件中。
我把在工作中学到的所有东西(从修复常见 IT 问题到新的技术知识)都记在 Org 里。我能把部分笔记以 HTML 的形式发布,供队友参考,也把一些笔记以 docx 格式发布,为我的主管生成任务报告。这让我看起来像是愿意多下功夫制作高质量文档的人。当然,我不需要为实现这一点而操心 HTML 或 docx 的细节。
在手机上访问我的 Org 笔记并不容易,所以(有趣的是)我用 Pandoc 将它们全部转换成 Markdown,以便在 Joplin 中用更友好的方式浏览它们。最后
为了避免在我必须为不同场景创建并与同事共享的各种文档格式之间频繁切换,我决定大多数文档都用 Org 撰写,然后导出为所需的任何格式。为此我使用 Org 的导出引擎或 Pandoc 。
我喜欢这种方法的原因是它完全免费且完全以纯文本形式存在。我可以将文档放入版本控制、检索它们、对其中一些处理流程做自动化处理等…… 然后再发布一些真正精美的文档与他人共享。
如果大家也需要产出大量文档,我强烈建议和我一样尝试使用单一文本格式 Org, 或者 Org+Pandoc 两者兼用。

