【可观测性工程】可观测性全景:Metrics、Logs、Traces、Profiles、Events 五大支柱 土法炼钢兴趣小组的博客 2026年4月22日 08:00 从控制论到云原生:拆解可观测性的五大信号支柱,对比监控与可观测性的本质区别,梳理开源/商业/SaaS 分类,以及国内互联网公司三大支柱落地现状与典型工程坑点。
【可观测性工程】可观测性 vs 监控:从 Zabbix/Nagios 到 OpenTelemetry 的二十年 土法炼钢兴趣小组的博客 2026年4月22日 08:00 监控与可观测性不是新旧迭代,而是认知模型的根本转换。本文梳理从 1999 年 Nagios 到 2019 年 OpenTelemetry 的二十年演进时间线,对比 push/pull 模型、数据模型差异,以及国内从 Zabbix 到 Prometheus 再到 OTel 的典型迁移路径与工程坑点。
【可观测性工程】指标体系设计:USE、RED、Golden Signals 与业务 KPI 土法炼钢兴趣小组的博客 2026年4月22日 08:00 USE 方法论适用于资源,RED 方法论适用于请求,Golden Signals 适用于服务——三套方法论各有其适用对象。本文从 Brendan Gregg、Tom Wilkie、Google SRE 的原始定义出发,构建覆盖资源→服务→业务的完整指标体系,并给出 Prometheus 命名规范、基数治理策略与可抄的指标清单。
【可观测性工程】Metrics:Prometheus、VictoriaMetrics、Thanos、Mimir、M3 土法炼钢兴趣小组的博客 2026年4月22日 08:00 从 Prometheus 架构与数据模型出发,系统梳理 Remote Write、PromQL 进阶、Thanos 全局聚合、Mimir 多租户、VictoriaMetrics 性能、M3DB 原理,以及五者在大规模生产场景下的对比矩阵与迁移实践。
【可观测性工程】时序数据库内核:TSM、TSI、倒排索引与 Gorilla 压缩 土法炼钢兴趣小组的博客 2026年4月22日 08:00 深入时序数据库的存储内核:Prometheus TSDB 的 WAL 与块管理、InfluxDB 的 TSM 引擎与 TSI 倒排索引、Gorilla 压缩算法的数学原理、VictoriaMetrics mergeset 架构、ClickHouse MergeTree 作为 metrics 后端,以及国内大厂在 series churn 和 compaction 风暴上踩过的坑。
【可观测性工程】Logs:Loki、ClickHouse、Elasticsearch、OpenObserve 的取舍 土法炼钢兴趣小组的博客 2026年4月22日 08:00 从日志场景分类出发,深入对比 Elasticsearch/OpenSearch、Grafana Loki、ClickHouse、OpenObserve 四大方案在全文检索、写入吞吐、存储成本、多租户和运维复杂度上的本质差异,结合 B 站、知乎 ClickHouse 日志平台实践,给出选型决策矩阵与工程坑点。
【可观测性工程】OpenTelemetry 深入:SDK、Collector、语义约定与版本演进 土法炼钢兴趣小组的博客 2026年4月22日 08:00 从 OpenTracing 与 OpenCensus 合并到今天的 OTel v1 稳定版,梳理 SDK 生命周期、Collector 流水线、OTLP 协议与 Semantic Conventions 的工程意义,并结合阿里 ARMS、观测云、夜莺等国内实践,给出多租户与尾采样的落地建议。
【可观测性工程】持续性能分析(Profiling):pprof、Pyroscope、Parca、async-profiler、JFR 土法炼钢兴趣小组的博客 2026年4月22日 08:00 从 CPU/heap/goroutine/lock/off-CPU 等 Profiling 种类出发,比较采样与插桩两类 profiler 的工作原理,深入 Go pprof、Java async-profiler/JFR、Python py-spy、Pyroscope、Parca eBPF Profiling,以及 OpenTelemetry Profiles 的最新进展,给出国内字节美团的真实落地经验与工程坑点。
【可观测性工程】Events 与变更关联:CloudEvents、发布打点、K8s 事件 土法炼钢兴趣小组的博客 2026年4月22日 08:00 把 Events 作为可观测性第四/五支柱来讲:变更事件、K8s Events、业务事件的数据模型,CloudEvents CNCF 规范,Kubernetes Event Exporter,Grafana Annotations,Argo Events,以及如何把发布打点与 Traces/Metrics 关联,实现\"变更即根因\"的故障响应方法论。
【可观测性工程】eBPF 可观测性全景:bcc、bpftrace、libbpf 的工程路径 土法炼钢兴趣小组的博客 2026年4月22日 08:00 eBPF 如何实现零侵入、内核级、低开销的可观测性:从 kprobe/uprobe/tracepoint/fentry 钩子机制,到 bcc 工具集、bpftrace 脚本语言、libbpf+CO-RE 可移植编程,再到 Pixie、DeepFlow、Grafana Beyla 等商业化工具,结合内核版本兼容性与生产部署实战。
【可观测性工程】网络可观测性:Cilium Hubble、Pixie、DeepFlow、Tetragon 土法炼钢兴趣小组的博客 2026年4月22日 08:00 从 L3/L4/L7 三层观测视角出发,讲解 eBPF socket filter/tc/XDP 的数据采集机制,深入 Cilium Hubble 流日志与指标体系、Tetragon 安全可观测、Pixie 自动化协议解析、国产 DeepFlow 的架构与实践,以及 TLS 解密、HTTP/2 解析、服务拓扑自动发现等核心工程挑战。
持续性能分析(Continuous Profiling):Parca、Pyroscope、Grafana Beyla 土法炼钢兴趣小组的博客 2026年4月22日 08:00 深入剖析持续性能分析(Continuous Profiling)的原理、架构与落地实践,覆盖 Parca、Pyroscope、Grafana Beyla 三大主流方案,包含 eBPF 采样、符号解析、火焰图、差异分析以及字节跳动、美团的生产案例与工程坑点。
可观测性工程 土法炼钢兴趣小组的博客 2026年4月22日 08:00 从 Metrics、Logs、Traces 到 Profiling、eBPF、OpenTelemetry 与 SLO 治理,面向中国工程团队的可观测性系统化手册。
【开源许可与版权工程】开源战略:什么时候开源、选哪个协议、如何构建商业壁垒 土法炼钢兴趣小组的博客 2026年4月22日 08:00 企业开源战略的完整决策框架:何时开源与为何开源、六种商业模式对比(Open Core/双许可/托管服务/支持服务/Source Available)、中国案例(PolarDB/OceanBase/TiDB/鸿蒙/麒麟)、协议改变的教训与代价、以及完整的决策树。
【开源许可与版权工程】开源许可证实操手册:从选型到发布 土法炼钢兴趣小组的博客 2026年4月22日 08:00 面向工程团队的开源许可证完整操作手册:许可证选型决策树、LICENSE/NOTICE/SPDX 文件写法、第三方依赖声明、CI 自动化检查、发布物合规标注,以及六套真实可复制的项目结构模板。
【开源许可与版权工程】闭源项目如何选择开源依赖:公司内部合规实操 土法炼钢兴趣小组的博客 2026年4月22日 08:00 面向做闭源/商业产品的团队:逐一拆解 MIT、LGPL、GPL、AGPL、SSPL、BSL 在 SaaS、私有化部署、移动 App、嵌入式固件等形态下的许可边界,给出三级名单模板、CI 扫描配置、SBOM 存证方案与出海补充要求。
开源许可与版权工程 土法炼钢兴趣小组的博客 2026年4月22日 08:00 面向中国工程团队的开源许可、版权与合规系列。从 GPL、AGPL、Apache、木兰协议到中国真实案例、SCA/SBOM 工具链与出海合规,讲清楚开源在工程落地中的坑与方法。
【开源许可与版权工程】红芯浏览器与「国产内核」往事:披皮事件的工程复盘 土法炼钢兴趣小组的博客 2026年4月22日 08:00 2018 年 8 月,红芯浏览器在完成 2.5 亿元融资后被发现基于 Chromium 换皮。本文从工程角度复盘这一事件:Chromium BSD-3 协议本身允许什么、不允许什么,如何通过文件指纹识别 Chromium 魔改,以及深度 Deepin、统信 UOS、麒麟 Kylin、中科曙光等国产系统的开源合规现状。
【开源许可与版权工程】中国 GPL 诉讼第一案系列:数字天堂、不乱买、罗盒 土法炼钢兴趣小组的博客 2026年4月22日 08:00 数字天堂 vs 柚子科技(2019)、不乱买案(2018)、罗盒 vs 玩友(2019–2020)——这批中国 GPL 诉讼案件厘清了 GPL 作为合同在中国法律框架下的效力,以及违反 GPL 的法律后果。本文梳理案件脉络、判决核心争议与工程合规启示。