阅读视图

Elisp 性能优化的六个实战教训

2026年4月23日 08:00

有人用 Elisp 写了一个 Org-mode 静态站点生成器，处理 10000 篇博文的时间从 5 分半压到 1 分 15 秒，热重载单篇只需 7 毫秒。实现过程中踩过的坑和发现的优化技巧，对任何在 Emacs 里处理大量文件的人都有参考价值。本文提取其中的工程实践，用你能在自己项目里直接用的方式讲清楚。 * 只解析你需要的东西 Elisp 里解析 Org 文件的标准方式是调用 =org-element-parse-buffer= 。它的默认行为是完整解析整个 buffer——包括行内标记、链接、脚注，全部递归展开。但如果你只需要提取文件开头的标题和日期，完整解析就是巨大的浪费。 =org-element-parse-buffer= 接受一个可选的 =GRANULARITY= 参数： - ='headline= :: 只解析标题结构 - ='greater-element= :: 不递归进入大元素内部，只解析顶层 - ='element= :: 解析所有元素但不解析行内对象 - ='object= :: 完整解析（默认）原文作者只需要标题和日期等元数据，把粒度从默认的 ='object= 改成 ='greater-element= ，单文件解析时间直接砍了一截。这不是微优化——对 10000 个文件来说，每个文件少解析几百个行内元素，累积效果显著。 #+begin_src emacs-lisp ;; 完整解析（慢） (org-element-parse-buffer) ;; 只解析顶层元素（快得多） (org-element-parse-buffer 'greater-element t) #+end_src 选择哪个粒度取决于你需要什么。提取元数据用 ='greater-element= ，需要处理链接和行内标记才用 ='object= 。 * 别让 find-file-noselect 拖慢批量操作 Emacs 有两种方式读取文件内容： 1. =find-file-noselect= —— 正经打开文件，创建一个完整的 buffer 2. =with-temp-buffer= + =insert-file-contents= —— 把文件内容塞进临时 buffer 原文作者一开始选了 =find-file-noselect= ，觉得它更"正确"。然后用 Emacs 内置的性能分析器（ =M-x profiler-start= ）一看，发现这个函数吃掉了 13% 的 CPU。原因： =find-file-noselect= 会触发文件锁、版本控制查询、major-mode hook、org-persist 缓存写入等一系列交互式操作。对每个文件都来一遍，10000 个文件就是在重复 10000 次不必要的开销。 #+begin_src emacs-lisp ;; 慢：触发完整的 buffer 初始化流程 (org-with-file-buffer filename (org-element-parse-buffer 'greater-element t)) ;; 快：用临时 buffer 直接读内容 (with-temp-buffer (insert-file-contents filename) (org-element-parse-buffer 'greater-element t)) #+end_src 切换到 =with-temp-buffer= 后，10000 篇博文的处理时间从 3 分 44 秒降到 1 分 15 秒。教训：批量处理文件时，用临时 buffer 而不是 =find-file-noselect= 。后者是为交互式编辑设计的，带着整套"官僚系统"。 * 用 cl-progv 隔离全局状态 Emacs 的状态管理建立在全局变量上—— =org-export-with-toc= 、 =org-html-link-home= 等都是全局变量。在同一个进程里处理多个 route 时，一个 route 设置的变量会"泄漏"到下一个 route。直觉上的做法是用 =let= 绑定： #+begin_src emacs-lisp (let ((org-export-with-toc t)) (opd-route ...)) ;; 这一步只是把 route 配置记下来 ;; 另一个 route (opd-route ...) (opd-export) ;; 真正的导出在这里执行 #+end_src 问题是： =opd-route= 不会立即执行导出，它只是把 route 的配置（输入模式、输出路径、过滤器等）存到一个列表里。真正的 HTML 生成发生在 =opd-export= 被调用的时候——但那时 =let= 的作用域已经结束了， =org-export-with-toc= 的局部绑定已经不存在了。换句话说，你在一个 =let= 块里填了一张表单，但处理表单的人要等到 =let= 块结束之后才看它，那时候表单上写的"特殊要求"已经没人记得了。那能不能把 =opd-export= 放进 =let= 里？也不行，因为不同 route 需要*不同的*变量值——blog route 要目录（ =org-export-with-toc= 为 =t= ），RSS route 不要目录（ =nil= ）。 =opd-export= 一次执行所有 route，你没法在一个 =let= 里同时给不同 route 设不同的值。解决方案是用 =cl-progv= ，这个来自 Common Lisp 的宏可以在运行时动态绑定一组变量。每个 route 把自己的变量设置写在 =:env= 属性里，引擎处理到那个 route 时才临时绑定，处理完自动恢复： #+begin_src emacs-lisp (cl-progv '(org-export-with-toc org-html-link-home) ;; 变量名列表 '(nil "http://localhost:8080") ;; 对应的值列表 ;; 在这个作用域里，org-export-with-toc 为 nil ;; org-html-link-home 为 "http://localhost:8080" (org-export-as 'rss)) #+end_src =cl-progv= 接受变量名列表和值列表，在执行 body 期间动态绑定这些变量，执行完后自动恢复。这比手动在每个 lambda 里 =let= 绑定更干净——你可以把变量配置做成数据，从 route 定义里传入，而不需要在每个导出函数里硬编码。 * 让数据形状决定行为，而不是手动标记原文遇到一个问题：blog route 和 rss route 都匹配 =*.org= 文件，两者都在全局注册表里写入 URL，互相覆盖。最初的解法是加一个 =:canonical= 标记，手动指定哪个 route 有写入权限。后来发现根本不需要这个标记。关键是观察聚合（aggregate）后数据的形状： - 1:1 route（每个文件对应一个输出）：数据的顶层有 =abspath= 属性 - 1:N route（多个文件聚合为一个输出，如 RSS）： =abspath= 藏在嵌套列表里 #+begin_src emacs-lisp (defun opd--tree-has-abspath-p (tree path) "递归搜索 Lisp 树中是否包含 (abspath . PATH) 。" (cond ((and (consp tree) (eq (car tree) 'abspath) (equal (cdr tree) path)) t) ((consp tree) (or (opd--tree-has-abspath-p (car tree) path) (opd--tree-has-abspath-p (cdr tree) path))) (t nil))) #+end_src 用数据结构本身的特征来区分行为，而不是引入额外的标记。这是 duck typing 的思想：不问"你是什么"，而是看"你长什么样"。消除了一个配置项，也消除了用户忘记设置它导致的 bug。 * 先 profile，再优化原文最有价值的教训之一：不要猜瓶颈在哪，用 Emacs 自带的性能分析器。 #+begin_src emacs-lisp ;; 启动 CPU profiler ;; M-x profiler-start cpu ;; 执行你的操作 ;; 查看报告 ;; M-x profiler-report #+end_src 原文作者的直觉告诉他瓶颈在字符串模板处理上。profiler 显示真正的罪魁祸首是 =find-file-noselect= （13% CPU）和 =org-persist-write-all-buffer= （12% CPU）。直觉和数据的差距巨大。性能优化的正确顺序： 1. 先写正确的代码 2. 用 profiler 找到真正的瓶颈 3. 只优化 profiler 指出的热点这个顺序对任何语言都适用，但在 Elisp 里尤其重要——因为 Elisp 的性能特征和直觉经常不一致。你以为慢的地方可能根本不是瓶颈，真正的热点藏在你不注意的地方。 * 哈希表替代线性扫描当文件数量从几十个增长到几千个时，线性扫描列表的成本从可以忽略变成不可接受。原文的处理方式很直接：任何需要按文件名查找的场景，用哈希表代替列表。 #+begin_src emacs-lisp ;; 慢：线性扫描，O(n) (member target-file file-list) ;; 快：哈希表查找，O(1) (gethash target-file file-hash-table) #+end_src 原文在路由注册表（registry）、文件缓存（filecache）、依赖图（depcache）三个地方都用哈希表，消除了所有线性扫描。对于 10000 个文件的场景，这个差异是"每个文件多查 10000 次"和"每个文件查 1 次"的差距。这不是过早优化——当你的数据量明确会达到千级别时，选择哈希表是基本的数据结构选择，就像去超市买东西用购物袋而不是一趟趟用手捧。 * 总结从这些优化中可以提炼出几条通用的 Elisp 工程原则： 1. *用正确的工具做正确的事* —— 临时 buffer 读文件， =find-file-noselect= 留给交互式场景 2. *只处理你需要的数据* —— =org-element-parse-buffer= 的粒度参数是个宝藏 3. *用 profiler 驱动优化* —— 不要猜，让数据说话 4. 用 =cl-progv= 隔离状态 —— 全局变量是 Emacs 的设计遗产， =cl-progv= 是在批量场景下控制它的有效手段 5. *让数据形状驱动逻辑* —— duck typing 比手动标记更不容易出错 6. *数据量大了就用哈希表* —— 这不是过早优化，是基本的数据结构选择

fcitx5 下 Emacs 无法切换输入法的排查

暗无天日

2026年4月23日 08:00

* 背景我之前从 fcitx4 升级到了 fcitx5，解决了键盘输入卡顿的问题（详见[[file:fcitx启动后键盘输入卡顿的排查.org][fcitx 启动后键盘输入卡顿的排查]]）。升级后，普通应用（浏览器、终端等）都能正常切换输入法，唯独 =Emacs= 不行——按切换快捷键毫无反应，只能输入英文。 * 故障现象 - fcitx5 在其他应用（Firefox、终端等）中正常工作 - 在 Emacs 中无法切换到中文输入法 - Emacs 是通过 =systemd user service= 以 daemon 模式启动的 - 系统为 Arch Linux，Emacs 版本 31.0.50，使用 Lucid（Xaw）工具包 * 排查过程 ** 第一步：检查环境变量输入法框架依赖三个关键环境变量来告诉应用程序"该用哪个输入法"。我先检查了当前 shell 中的值： #+begin_src shell echo "GTK_IM_MODULE=$GTK_IM_MODULE" echo "QT_IM_MODULE=$QT_IM_MODULE" echo "XMODIFIERS=$XMODIFIERS" #+end_src #+begin_example GTK_IM_MODULE=fcitx5 QT_IM_MODULE=fcitx5 XMODIFIERS=@im=fcitx5 #+end_example 三个变量都有值，看起来没问题。 #+BEGIN_QUOTE *小知识：这三个环境变量是干什么的？* Linux 下的应用程序通过三种不同的协议连接输入法： 1. =XMODIFIERS=@im=xxx= ：告诉 *所有 X11 应用* ，通过 XIM 协议连接名为 =xxx= 的输入法服务器。这是最古老的方案，几乎所有 X 应用都支持，但功能最基础。 2. =GTK_IM_MODULE=xxx= ：让 *GTK 应用* 加载专门的输入法模块，比 XIM 体验更好（支持光标跟随、预编辑文字等）。 3. =QT_IM_MODULE=xxx= ：同理，让 *Qt 应用* 加载专门的输入法模块。简单来说：=XMODIFIERS= 是万能兜底方案，=GTK_IM_MODULE= 和 =QT_IM_MODULE= 是各自框架的增强方案。 #+END_QUOTE ** 第二步：运行 fcitx5-diagnose fcitx5 自带了一个诊断工具，可以自动检查各种常见配置问题： #+begin_src shell fcitx5-diagnose #+end_src 诊断结果里出现了多处警告： #+begin_example 环境变量 XMODIFIERS 的值被设为了"@im=fcitx5"而不是"@im=fcitx"。请检查您是否在某个初始化文件中错误的设置了它的值。环境变量 GTK_IM_MODULE 的值被设为了"fcitx5"而不是"fcitx"。环境变量 QT_IM_MODULE 的值被设为了"fcitx5"而不是"fcitx"。 #+end_example 诊断工具建议把所有值从 =fcitx5= 改成 =fcitx= 。看起来很合理——虽然软件叫 =fcitx5= ，但输入法模块注册的名字可能不带版本号。于是我按建议修改了 =~/.xinitrc= ： #+begin_src shell # 修改前 export GTK_IM_MODULE=fcitx5 export QT_IM_MODULE=fcitx5 export XMODIFIERS="@im=fcitx5" # 修改后 export GTK_IM_MODULE=fcitx export QT_IM_MODULE=fcitx export XMODIFIERS="@im=fcitx" #+end_src 但问题没有解决——Emacs 还是无法切换输入法。 #+BEGIN_QUOTE *小知识：=.xinitrc= 是什么？* 当你用 =startx= 命令启动图形界面时，=X 服务器= 会读取 =~/.xinitrc= 这个文件，执行里面的命令来初始化桌面环境。通常在里面设置环境变量、启动输入法、启动窗口管理器等。 #+END_QUOTE ** 第三步：发现 Emacs 是 systemd 服务启动的我意识到一个关键问题：我的 Emacs 不是从 =.xinitrc= 启动的，而是通过 =systemd user service= 以 daemon 模式在后台运行的。 #+BEGIN_QUOTE *小知识：Emacs daemon 模式* Emacs 可以以"守护进程"方式运行（=emacs --fg-daemon= 或 =emacs --daemon=），在后台常驻。之后用 =emacsclient= 连接到这个后台进程来打开窗口。好处是： - 启动速度极快（不用每次都重新加载配置） - 多个客户端共享同一个 Emacs 进程（状态、缓冲区等） #+END_QUOTE 这意味着 Emacs 的环境变量 *不来自 =.xinitrc=* ，而是来自 systemd service 文件中的 =Environment= 配置。查看服务文件： #+begin_src shell cat ~/.config/systemd/user/emacs.service #+end_src #+begin_example [Service] Type=simple ExecStart=/usr/bin/emacs --fg-daemon Environment=... GTK_IM_MODULE=fcitx QT_IM_MODULE=fcitx XMODIFIERS="@im=fcitx" ... #+end_example 果然！Emacs 的环境变量是独立的： - =GTK_IM_MODULE=fcitx= - =QT_IM_MODULE=fcitx= - =XMODIFIERS="@im=fcitx" 看起来都是正确的 ** 第四步：发现根因——XIM 服务器名称不匹配既然 =.xinitrc= 和 =emacs.service= 都设了 =XMODIFIERS= ，那问题出在哪里？我检查了 fcitx5 实际注册到 X 服务器的 XIM 服务名称： #+begin_src shell xprop -root XIM_SERVERS #+end_src #+begin_example XIM_SERVERS(ATOM) = @server=fcitx5 #+end_example 然后检查 Emacs 进程实际的 =XMODIFIERS= 值： #+begin_src shell cat /proc/$(pgrep -x emacs)/environ | tr '\0' '\n' | grep XMODIFIERS #+end_src #+begin_example XMODIFIERS=@im=fcitx #+end_example *找到根因了！* - fcitx5 注册的 XIM 服务器名： =@server=fcitx5= - Emacs 的 =XMODIFIERS= 值： =@im=fcitx= 两者不匹配！XIM 协议要求 =XMODIFIERS= 的值必须和 XIM 服务器的注册名一致。Emacs 拿着 =@im=fcitx= 去找名为 =fcitx= 的 XIM 服务器，但实际注册的名字是 =fcitx5= ，当然找不到。 #+BEGIN_QUOTE *小知识：XIM 协议的连接机制* XIM（X Input Method）是 X11 的输入法协议，工作流程是： 1. 输入法框架（如 fcitx5）启动后，在 X 服务器上注册一个 XIM 服务器，名字形如 =@server=fcitx5= 2. 应用程序读取 =XMODIFIERS= 环境变量（如 =@im=fcitx5=） 3. 应用程序拿着这个名字去 X 服务器上查找对应的 XIM 服务器 4. 找到后建立连接，输入法就可以工作了如果 =XMODIFIERS= 的名字和 XIM 服务器注册的名字对不上，应用程序就找不到输入法服务器，输入法自然无法使用。 #+END_QUOTE 这也说明 =fcitx5-diagnose= 的建议是 *误导* 的：它建议把 =XMODIFIERS= 改成 =@im=fcitx= ，但 fcitx5 的 XIM 服务器偏偏注册为 =fcitx5= 。对于通过 XIM 协议连接输入法的应用（比如使用 Lucid 工具包的 Emacs），这个建议反而是错的。 ** 第五步：确认 Emacs 走的是 XIM 而非 GTK 模块为了确认我的 Emacs 确实走 XIM 协议，我检查了 Emacs 的构建特性： #+begin_src shell emacs --batch --eval '(princ (format "%s\n" system-configuration-features))' #+end_src #+begin_example ... X11 XDBE XIM XINPUT2 ... LUCID ... #+end_example 关键信息： - =XIM= ——Emacs 支持 XIM 协议 - =LUCID= ——Emacs 使用 Lucid（Xaw）工具包，不是 GTK Lucid 工具包不使用 =GTK_IM_MODULE= ，只走 XIM 协议。所以对 Emacs 来说，唯一重要的环境变量就是 =XMODIFIERS= ，而且它的值必须和 XIM 服务器注册名一致。 * 解决方案明确了根因后，修复很简单： ** 修改 emacs.service 中的 XMODIFIERS 将 =XMODIFIERS="@im=fcitx"= 改为 =XMODIFIERS="@im=fcitx5"= ： #+begin_example # 修改前 Environment=... XMODIFIERS="@im=fcitx" ... # 修改后 Environment=... XMODIFIERS="@im=fcitx5" ... #+end_example ** 重启 Emacs 服务 #+begin_src shell systemctl --user daemon-reload systemctl --user restart emacs #+end_src 修改后确认 Emacs 进程的环境变量已更新： #+begin_src shell cat /proc/$(pgrep -x emacs)/environ | tr '\0' '\n' | grep XMODIFIERS # XMODIFIERS=@im=fcitx5 #+end_src 重启后 Emacs 中顺利切换到中文输入法，问题解决。 ** 恢复 .xinitrc 由于我的桌面环境也使用 fcitx5 ，且 fcitx5 的 XIM 服务器注册名为 =fcitx5= ，所以 =~/.xinitrc= 中的值保持为 =fcitx5= 是正确的： #+begin_src shell export GTK_IM_MODULE=fcitx5 export QT_IM_MODULE=fcitx5 export XMODIFIERS="@im=fcitx5" #+end_src * 复盘 ** 根因链条 #+begin_example fcitx5 注册 XIM 服务器名为 "@server=fcitx5" → emacs.service 中 XMODIFIERS="@im=fcitx" → 名称不匹配 → Emacs 通过 XIM 找不到输入法服务器 → 无法切换输入法 #+end_example ** 走过的弯路这次排查最大的弯路是 *轻信了 =fcitx5-diagnose= 的建议* 。它建议把所有环境变量从 =fcitx5= 改成 =fcitx= ，我照做了，但这反而让 XMODIFIERS 和 XIM 服务器名不匹配的问题更加恶化了。 ** 关键经验 1. *=xprop -root XIM_SERVERS= 可以查看 XIM 服务器注册名* ：排查 XIM 问题时，先确认服务器叫什么名字，再和 =XMODIFIERS= 对比 2. *systemd 服务的环境变量是独立的* ：不继承 =.xinitrc= 或 shell 的环境，需要在 service 文件中单独设置。遇到服务启动的程序出问题时，用 =cat /proc/$PID/environ | tr '\0' '\n' | grep XXX= 检查实际的环境变量 3. *诊断工具的建议不一定全对* ：=fcitx5-diagnose= 的建议在大部分场景下是对的，但对于 XIM 这种特殊场景会给出错误建议。理解原理比盲目执行建议更重要 4. *Emacs 的工具包决定了它用什么输入法协议* ：Lucid 走 XIM（看 =XMODIFIERS= ），GTK 走 GTK IM Module（看 =GTK_IM_MODULE= ）。排查前先搞清楚 Emacs 用的什么工具包

Qwen3.6-27B：基于270亿参数密集模型的旗舰级编码

Hacker News 热门

mfiguiere

2026年4月23日 00:08

Qwen3.6-27B: Flagship-Level Coding in a 27B Dense Model (qwen.ai)