普通视图

今天 — 2026年4月24日暗无天日

暗无天日
WSL9x —— 在 Windows 9x 里跑 Linux 内核 6.19
最近看到一个很有意思的项目：把 Linux 内核搬进了 Windows 9x。微软的 WSL（Windows Subsystem for Linux）让 Linux 跑在 Windows 10/11 里，已经够让人吃惊了。但开源开发者 Hailey 更进一步——她让 Linux 内核 6.19 跑在了 Windows 9x（95、98、ME）里。项目名叫 [[https://codeberg.org/nicholatian/wsl9x][WSL9x]]。 * 它怎么做到的？ WSL9x 的核心思路是用 Linux 的 User Mode Linux（UML）架构——一种让 Linux 内核作为用户态进程运行的设计。Hailey 基于 UML 做了定制（对应 Codeberg 上的 =win9x-um-6.19= 分支），把内核移植到了 Win9x 环境下：补丁后的内核被加载到固定的内存地址（ =0xd0000000= ），一个 VxD（Win9x 的虚拟设备驱动）负责把内核从磁盘读进来，然后处理页面错误和系统调用。比较巧妙的是系统调用的处理方式。Win9x 没有提供 Linux
2026年4月24日 08:00

WSL9x —— 在 Windows 9x 里跑 Linux 内核 6.19

2026年4月24日 08:00

最近看到一个很有意思的项目：把 Linux 内核搬进了 Windows 9x。微软的 WSL（Windows Subsystem for Linux）让 Linux 跑在 Windows 10/11 里，已经够让人吃惊了。但开源开发者 Hailey 更进一步——她让 Linux 内核 6.19 跑在了 Windows 9x（95、98、ME）里。项目名叫 [[https://codeberg.org/nicholatian/wsl9x][WSL9x]]。 * 它怎么做到的？ WSL9x 的核心思路是用 Linux 的 User Mode Linux（UML）架构——一种让 Linux 内核作为用户态进程运行的设计。Hailey 基于 UML 做了定制（对应 Codeberg 上的 =win9x-um-6.19= 分支），把内核移植到了 Win9x 环境下：补丁后的内核被加载到固定的内存地址（ =0xd0000000= ），一个 VxD（Win9x 的虚拟设备驱动）负责把内核从磁盘读进来，然后处理页面错误和系统调用。比较巧妙的是系统调用的处理方式。Win9x 没有提供 Linux 标准的系统调用中断表支持，所以 WSL9x 没有走常规的 =int 0x80= 路线，而是通过异常处理函数来拦截和转发 Linux 的系统调用。终端交互靠一个叫 =wsl.com= 的 16 位 DOS 程序，它把 Linux 的终端输出管道传回你运行它的那个 DOS 窗口。对，你在一台跑 Windows 98 的机器上打开 MS-DOS 提示符，输入 =wsl= ，就能看到 Linux 内核的启动输出。 * 不需要虚拟化，i486 就能跑整个方案不依赖任何硬件虚拟化——没有 VT-x、没有 AMD-V。Hailey 说它理论上能在 i486 处理器上运行。巧合的是，i486 正好是 Linux 内核即将放弃支持的最老架构。这么一看，WSL9x 等于给了一台快要被 Linux 内核抛弃的老机器一个继续跑 Linux 的机会——只不过是在 Windows 9x 里面跑。项目目前没有提供预编译的二进制文件，想玩的话需要自己从 [[https://codeberg.org/nicholatian/wsl9x][Codeberg 上的源码]] 构建并部署到一台真正的 Windows 9x 系统上。虽然实用性有限，但作为一个技术实验，它的思路和实现都很有意思。

2026年4月23日 08:00

* 背景我之前从 fcitx4 升级到了 fcitx5，解决了键盘输入卡顿的问题（详见[[file:fcitx启动后键盘输入卡顿的排查.org][fcitx 启动后键盘输入卡顿的排查]]）。升级后，普通应用（浏览器、终端等）都能正常切换输入法，唯独 =Emacs= 不行——按切换快捷键毫无反应，只能输入英文。 * 故障现象 - fcitx5 在其他应用（Firefox、终端等）中正常工作 - 在 Emacs 中无法切换到中文输入法 - Emacs 是通过 =systemd user service= 以 daemon 模式启动的 - 系统为 Arch Linux，Emacs 版本 31.0.50，使用 Lucid（Xaw）工具包 * 排查过程 ** 第一步：检查环境变量输入法框架依赖三个关键环境变量来告诉应用程序"该用哪个输入法"。我先检查了当前 shell 中的值： #+begin_src shell echo "GTK_IM_MODULE=$GTK_IM_MODULE" echo "QT_IM_MODULE=$QT_IM_MODULE" echo "XMODIFIERS=$XMODIFIERS" #+end_src #+begin_example GTK_IM_MODULE=fcitx5 QT_IM_MODULE=fcitx5 XMODIFIERS=@im=fcitx5 #+end_example 三个变量都有值，看起来没问题。 #+BEGIN_QUOTE *小知识：这三个环境变量是干什么的？* Linux 下的应用程序通过三种不同的协议连接输入法： 1. =XMODIFIERS=@im=xxx= ：告诉 *所有 X11 应用* ，通过 XIM 协议连接名为 =xxx= 的输入法服务器。这是最古老的方案，几乎所有 X 应用都支持，但功能最基础。 2. =GTK_IM_MODULE=xxx= ：让 *GTK 应用* 加载专门的输入法模块，比 XIM 体验更好（支持光标跟随、预编辑文字等）。 3. =QT_IM_MODULE=xxx= ：同理，让 *Qt 应用* 加载专门的输入法模块。简单来说：=XMODIFIERS= 是万能兜底方案，=GTK_IM_MODULE= 和 =QT_IM_MODULE= 是各自框架的增强方案。 #+END_QUOTE ** 第二步：运行 fcitx5-diagnose fcitx5 自带了一个诊断工具，可以自动检查各种常见配置问题： #+begin_src shell fcitx5-diagnose #+end_src 诊断结果里出现了多处警告： #+begin_example 环境变量 XMODIFIERS 的值被设为了"@im=fcitx5"而不是"@im=fcitx"。请检查您是否在某个初始化文件中错误的设置了它的值。环境变量 GTK_IM_MODULE 的值被设为了"fcitx5"而不是"fcitx"。环境变量 QT_IM_MODULE 的值被设为了"fcitx5"而不是"fcitx"。 #+end_example 诊断工具建议把所有值从 =fcitx5= 改成 =fcitx= 。看起来很合理——虽然软件叫 =fcitx5= ，但输入法模块注册的名字可能不带版本号。于是我按建议修改了 =~/.xinitrc= ： #+begin_src shell # 修改前 export GTK_IM_MODULE=fcitx5 export QT_IM_MODULE=fcitx5 export XMODIFIERS="@im=fcitx5" # 修改后 export GTK_IM_MODULE=fcitx export QT_IM_MODULE=fcitx export XMODIFIERS="@im=fcitx" #+end_src 但问题没有解决——Emacs 还是无法切换输入法。 #+BEGIN_QUOTE *小知识：=.xinitrc= 是什么？* 当你用 =startx= 命令启动图形界面时，=X 服务器= 会读取 =~/.xinitrc= 这个文件，执行里面的命令来初始化桌面环境。通常在里面设置环境变量、启动输入法、启动窗口管理器等。 #+END_QUOTE ** 第三步：发现 Emacs 是 systemd 服务启动的我意识到一个关键问题：我的 Emacs 不是从 =.xinitrc= 启动的，而是通过 =systemd user service= 以 daemon 模式在后台运行的。 #+BEGIN_QUOTE *小知识：Emacs daemon 模式* Emacs 可以以"守护进程"方式运行（=emacs --fg-daemon= 或 =emacs --daemon=），在后台常驻。之后用 =emacsclient= 连接到这个后台进程来打开窗口。好处是： - 启动速度极快（不用每次都重新加载配置） - 多个客户端共享同一个 Emacs 进程（状态、缓冲区等） #+END_QUOTE 这意味着 Emacs 的环境变量 *不来自 =.xinitrc=* ，而是来自 systemd service 文件中的 =Environment= 配置。查看服务文件： #+begin_src shell cat ~/.config/systemd/user/emacs.service #+end_src #+begin_example [Service] Type=simple ExecStart=/usr/bin/emacs --fg-daemon Environment=... GTK_IM_MODULE=fcitx QT_IM_MODULE=fcitx XMODIFIERS="@im=fcitx" ... #+end_example 果然！Emacs 的环境变量是独立的： - =GTK_IM_MODULE=fcitx= - =QT_IM_MODULE=fcitx= - =XMODIFIERS="@im=fcitx" 看起来都是正确的 ** 第四步：发现根因——XIM 服务器名称不匹配既然 =.xinitrc= 和 =emacs.service= 都设了 =XMODIFIERS= ，那问题出在哪里？我检查了 fcitx5 实际注册到 X 服务器的 XIM 服务名称： #+begin_src shell xprop -root XIM_SERVERS #+end_src #+begin_example XIM_SERVERS(ATOM) = @server=fcitx5 #+end_example 然后检查 Emacs 进程实际的 =XMODIFIERS= 值： #+begin_src shell cat /proc/$(pgrep -x emacs)/environ | tr '\0' '\n' | grep XMODIFIERS #+end_src #+begin_example XMODIFIERS=@im=fcitx #+end_example *找到根因了！* - fcitx5 注册的 XIM 服务器名： =@server=fcitx5= - Emacs 的 =XMODIFIERS= 值： =@im=fcitx= 两者不匹配！XIM 协议要求 =XMODIFIERS= 的值必须和 XIM 服务器的注册名一致。Emacs 拿着 =@im=fcitx= 去找名为 =fcitx= 的 XIM 服务器，但实际注册的名字是 =fcitx5= ，当然找不到。 #+BEGIN_QUOTE *小知识：XIM 协议的连接机制* XIM（X Input Method）是 X11 的输入法协议，工作流程是： 1. 输入法框架（如 fcitx5）启动后，在 X 服务器上注册一个 XIM 服务器，名字形如 =@server=fcitx5= 2. 应用程序读取 =XMODIFIERS= 环境变量（如 =@im=fcitx5=） 3. 应用程序拿着这个名字去 X 服务器上查找对应的 XIM 服务器 4. 找到后建立连接，输入法就可以工作了如果 =XMODIFIERS= 的名字和 XIM 服务器注册的名字对不上，应用程序就找不到输入法服务器，输入法自然无法使用。 #+END_QUOTE 这也说明 =fcitx5-diagnose= 的建议是 *误导* 的：它建议把 =XMODIFIERS= 改成 =@im=fcitx= ，但 fcitx5 的 XIM 服务器偏偏注册为 =fcitx5= 。对于通过 XIM 协议连接输入法的应用（比如使用 Lucid 工具包的 Emacs），这个建议反而是错的。 ** 第五步：确认 Emacs 走的是 XIM 而非 GTK 模块为了确认我的 Emacs 确实走 XIM 协议，我检查了 Emacs 的构建特性： #+begin_src shell emacs --batch --eval '(princ (format "%s\n" system-configuration-features))' #+end_src #+begin_example ... X11 XDBE XIM XINPUT2 ... LUCID ... #+end_example 关键信息： - =XIM= ——Emacs 支持 XIM 协议 - =LUCID= ——Emacs 使用 Lucid（Xaw）工具包，不是 GTK Lucid 工具包不使用 =GTK_IM_MODULE= ，只走 XIM 协议。所以对 Emacs 来说，唯一重要的环境变量就是 =XMODIFIERS= ，而且它的值必须和 XIM 服务器注册名一致。 * 解决方案明确了根因后，修复很简单： ** 修改 emacs.service 中的 XMODIFIERS 将 =XMODIFIERS="@im=fcitx"= 改为 =XMODIFIERS="@im=fcitx5"= ： #+begin_example # 修改前 Environment=... XMODIFIERS="@im=fcitx" ... # 修改后 Environment=... XMODIFIERS="@im=fcitx5" ... #+end_example ** 重启 Emacs 服务 #+begin_src shell systemctl --user daemon-reload systemctl --user restart emacs #+end_src 修改后确认 Emacs 进程的环境变量已更新： #+begin_src shell cat /proc/$(pgrep -x emacs)/environ | tr '\0' '\n' | grep XMODIFIERS # XMODIFIERS=@im=fcitx5 #+end_src 重启后 Emacs 中顺利切换到中文输入法，问题解决。 ** 恢复 .xinitrc 由于我的桌面环境也使用 fcitx5 ，且 fcitx5 的 XIM 服务器注册名为 =fcitx5= ，所以 =~/.xinitrc= 中的值保持为 =fcitx5= 是正确的： #+begin_src shell export GTK_IM_MODULE=fcitx5 export QT_IM_MODULE=fcitx5 export XMODIFIERS="@im=fcitx5" #+end_src * 复盘 ** 根因链条 #+begin_example fcitx5 注册 XIM 服务器名为 "@server=fcitx5" → emacs.service 中 XMODIFIERS="@im=fcitx" → 名称不匹配 → Emacs 通过 XIM 找不到输入法服务器 → 无法切换输入法 #+end_example ** 走过的弯路这次排查最大的弯路是 *轻信了 =fcitx5-diagnose= 的建议* 。它建议把所有环境变量从 =fcitx5= 改成 =fcitx= ，我照做了，但这反而让 XMODIFIERS 和 XIM 服务器名不匹配的问题更加恶化了。 ** 关键经验 1. *=xprop -root XIM_SERVERS= 可以查看 XIM 服务器注册名* ：排查 XIM 问题时，先确认服务器叫什么名字，再和 =XMODIFIERS= 对比 2. *systemd 服务的环境变量是独立的* ：不继承 =.xinitrc= 或 shell 的环境，需要在 service 文件中单独设置。遇到服务启动的程序出问题时，用 =cat /proc/$PID/environ | tr '\0' '\n' | grep XXX= 检查实际的环境变量 3. *诊断工具的建议不一定全对* ：=fcitx5-diagnose= 的建议在大部分场景下是对的，但对于 XIM 这种特殊场景会给出错误建议。理解原理比盲目执行建议更重要 4. *Emacs 的工具包决定了它用什么输入法协议* ：Lucid 走 XIM（看 =XMODIFIERS= ），GTK 走 GTK IM Module（看 =GTK_IM_MODULE= ）。排查前先搞清楚 Emacs 用的什么工具包

昨天以前暗无天日

读 Seeing the Whole System

暗无天日

2026年4月22日 08:00

原文：[[https://dzone.com/articles/seeing-the-whole-system][Seeing the Whole System - DZone]] 这篇 DZone 上的文章从一个事故应急响应的真实场景出发，讲透了可观测性（observability）领域最痛的问题：你的监控数据散落在四五个互不相干的系统里，出了事得靠人脑手动拼凑上下文。然后讲了 OpenTelemetry（简称 OTel）怎么从架构层面解决这个问题。 * 你可能也经历过的事故现场事故响应进行到第 47 分钟，值班工程师已经开了 6 个浏览器 tab：Grafana 看基础设施指标，Splunk 搜应用日志，Jaeger 查链路追踪，还有一个 18 个月前谁搭的 Kibana 面板，还有一个团队 6 周前开通的 Datadog 试用版，但和其他系统完全没有打通。根因是一个下游依赖在高负载下开始出现响应超时，导致某个没配队列监控的服务队列出现堆积。线索分布在四个互不相干的系统里，工程师得用脑子手动关联。这个场景不是个例。大多数组织的监控工具链是这么长出来的：A 团队需要指标，上了 Prometheus；B 团队做链路追踪，选了 Jaeger；安全团队要日志聚合，部署了 ELK；新来的工程师喜欢 Datadog，自己开了个试用。每个决定单独看都没错，但最终结果是四五个互不相干的系统，各自只能看到环境的一部分。当故障跨系统边界传播时（尤其在微服务环境下，经常出现这样的故障），代价就很明显了：不同系统之间的追踪数据无法互通——比如 A 服务用了 Jaeger 埋点，B 服务用了 Datadog 埋点，两个服务的 trace 数据对不上；一个系统的日志时间戳和另一个系统的指标尖峰对不上，还得花时间排除到底是时区不同还是真实的因果顺序。 * OpenTelemetry 是什么 OTel 不是一个工具，而是一套规范（specification）+ API + SDK + Collector。它解决的核心问题是：让应用代码只管发射遥测数据，不关心数据发给哪个后端。具体来说： 1. 应用代码通过 OTel SDK 埋点，数据通过 =OTLP= （OpenTelemetry Protocol）协议发送 2. Collector 是一个独立的中间服务，负责接收、处理、路由遥测数据 3. 切换后端（比如从 Jaeger 换成 Datadog）只需要改 Collector 配置，应用代码完全不用动 #+BEGIN_SRC yaml :eval no # Collector 最小配置：一个接收器 + 一个处理器 + 一个导出器 receivers: otlp: protocols: grpc: endpoint: 0.0.0.0:4317 processors: batch: timeout: 5s send_batch_size: 1024 exporters: otlp/jaeger: endpoint: jaeger:4317 service: pipelines: traces: receivers: [otlp] processors: [batch] exporters: [otlp/jaeger] #+END_SRC 在 OTel 成熟之前（核心组件大约在 2023 年才达到生产稳定性），给应用做可观测性埋点意味着绑定某个厂商的 agent 或 SDK。想从 A 厂商换到 B 厂商？需要改代码、换库、重新测试。OTel 的厂商无关的设计把这个成本降到了配置变更。 * Collector：最容易用错的组件原文观察到团队对 Collector 有两种典型的误用： 1. *用得太简单*：把 Collector 当透传管道，原样转发所有数据到后端，不做过滤、采样、富化。配置虽然集中了，但浪费了中间处理层的能力 2. *过度复杂化*：一开始就往 5 个后端同时发数据，加上复杂的处理器链和多套采样策略。6 个月后没人能完整解释这个配置做得好的团队遵循一个模式：从一个 receiver、一个 processor、一两个 exporter 开始，逐步扩展。Collector 配置放 Git 里，变更走 code review。Collector 本身也当服务对待——有 owner、有 SLO、有值班轮换。一个实用的 Collector 模式是 *tail-based sampling* （尾部采样）：在源头全面埋点，在 Collector 层配置只把 10-15% 的 trace 发到昂贵的存储后端，但保留 100% 的错误和慢请求 trace。该看的问题一个不漏，但摄入成本大幅降低。 * 关联查询：统一遥测最大的价值统一遥测标准最大的好处不是省钱或换后端方便，而是可以做关联查询——从一个指标异常，跳到解释它的 trace，再跳到定位具体操作的日志行。 OTel 的 trace 上下文传播机制（即请求从 A 服务调到 B 服务时，自动把 trace ID 带过去）让这个关联变成自动的：同一个请求经过的每个服务都用同一个 trace ID 串起来： #+BEGIN_SRC text :eval no # traceparent header 格式：version-trace_id-parent_id-trace_flags traceparent: 00-4bf92f3577b34da6a3ce929d0e0e4736-00f067aa0ba902b7-01 #+END_SRC 如果你的日志也带着这个 trace ID （OTel 的日志埋点会处理），就可以从 trace 中的慢 span 直接跳到该 span 产生的日志行，在一个系统里完成。原文提到一个初级工程师用这种方式做了根因分析，值班负责人估计这在 OTel 迁移前要 40 分钟，实际只用了 9 分钟。 * 还没有解决的问题 - *自动埋点的局限*：OTel 的 auto-instrumentation 对标准 HTTP 调用、数据库查询、gRPC 很好用，但对自定义消息队列、遗留协议、内部框架仍然需要手动埋点——这部分工作很麻烦 - *日志集成滞后*：trace 和 metric 在 OTel 中已经成熟稳定，但日志规范的 SDK 实现仍在追赶。原文建议的渐进策略是：先在现有日志输出中加上 trace ID 和 span ID，等运维图景更清晰后再迁移收集路径 - *Collector 本身需要维护*：处理几十个服务的高基数遥测数据的 Collector 需要容量规划、故障分析、持续运维。不能当"设好就忘"的组件

TIL: 早期网页的图片热区导航

暗无天日

暗无天日

2026年4月20日 08:00

* 这篇"教程"在干什么 [[https://modem.io/blog/blog-monetization/][How to Monetize a Blog]] 是 modem.io 上的一篇文章。乍一看，这是一篇博客变现指南——讲 CPM、CPA、广告网络、受众画像，跟你搜到的任何一篇"如何靠博客赚钱"没什么区别。但读完全文才发现，这是一篇精心设计的讽刺作品——它就是它所讽刺的那个东西。 * 四层递进的讽刺手法 ** 第一层：正经教程的伪装文章开头非常像回事。它解释了 CPM（千次展示付费）和 CPA（按行动付费）的区别，介绍了广告网络的运作方式，甚至讨论了如何根据受众画像投放定向广告。这些内容本身是准确的，读起来就像一篇标准的 SEO 变现教程。这个伪装做得越逼真，后面的反转就越有力。 ** 第二层：荒诞的假广告从文章开头开始，就穿插着各种广告位。但仔细一看，这些广告卖的是： - "虾探测器"（ Shrimp detectors ） - "定制塔罗牌" - "蛇油"（ Literal Snake Oil——"从真正的蛇身上现榨的油" ） - "药用盲盒"（ Medicinal Loot Boxes——"禁止医生入内" ） - "和三明治交朋友"（ Befriend A Sandwich——"你的法式蘸酱三明治知道宝藏在哪吗？" ）每一则假广告的荒诞程度都在递增。而且这些广告和文章内容毫无关系——这本身就是一种讽刺：广告系统号称能精准匹配内容和广告，实际投放出来的东西根本和内容无关。 ** 第三层：作者自我拆穿写到大半的时候，作者突然摊牌了。他说： #+begin_quote this entire post is admittedly just meaningless fluff that I'm not even proof-reading. It's all a thoughtless heap of words in disguise, an excuse to fill more ad space. And it is working! 这整篇文章说实话就是毫无意义的填充物，我连校对都没做。这是一堆词的伪装，一个塞更多广告位的借口。而且它奏效了！ #+end_quote 然后他"建议"你可以用 AI 来写内容，或者干脆用 lorem ipsum（排版时用来占位置的假文字）来填充文章后半部分——因为只要前面的文字看起来像人写的，读者就不会注意到后面是机器生成的废话。这正是内容农场的真实操作：用廉价内容填充页面，只要能展示广告就行，内容本身毫无价值。这一层的巧妙之处在于：作者一边在做他正在批评的事（用废话填空间），一边告诉你他在这么做。你作为读者，明知被耍了，但广告已经展示在你面前了。 ** 第四层：文风崩塌最后几段，文章彻底放弃了教程的伪装。文风从幽默滑向了一种接近克苏鲁式的黑暗散文： #+begin_quote We invent new gods and we bury them in the same breath. We leave scars on the world like canyons carved from rivers of glass. 我们在制造新的神，又在同一口气中埋葬它们。我们在世界上留下伤疤，像河流冲刷出的玻璃峡谷。 #+end_quote 然后是一段"拆了建、建了拆"无限重复的文本，最后以一片黑暗中蠕动的触须意象收尾。这个文风崩塌大概不是作者失控，而是一种有意的隐喻：当内容创作者完全被流量和广告驱动时，内容本身就会退化成这样的东西——没有意义、没有方向、无限循环。 * 中国互联网的镜像这篇文章讽刺的是英文互联网的广告生态，但这些手法放在中国互联网上只会变本加厉。百度的搜索结果页，前几条永远是广告。公众号文章读着读着突然插入一条带货链接。短视频平台的内容越来越像广告，广告越来越像内容。B 站的弹幕里混着"恰饭"的辩解。我们每天消费的内容，有多少是真正为读者写的，又有多少是"有意义的填充物"？和这篇讽刺文里的做法相比，区别只在于：这些平台可不会自爆。 modem.io 这篇文章最狠的地方在于，它没有用论述的方式告诉你"广告正在毁掉互联网"，而是让你亲身体验了一把——你读完了它，你的注意力被假广告收割了，然后文章告诉你：刚才经历的就是问题本身。 * 为什么这篇讽刺有效好的讽刺不靠说理，靠的是让你读完之后回头一看，发现自己刚才的阅读体验本身就是被讽刺的对象。这篇文章做到了： 1. *形式即内容* ——它用广告充斥的排版来讽刺广告充斥的互联网，读者不需要"被说服"，只需要"经历一遍" 2. *诚实是最好的嘲讽* ——作者直接承认"这篇文章就是垃圾"，这种自曝比任何批评都尖锐 3. *递进的荒诞感* ——从正经教程到假广告到自我拆穿到文风崩溃，每一层都把讽刺推得更深这种结构性的讽刺手法并不常见——大部分讽刺靠的是文字游戏和双关，而这篇文章让文章的结构本身成为了论点。