阅读视图

发现新文章,点击刷新页面。
🔲 ☆

Docker 的十年:重塑云原生基础设施的“底层炼金术”

本文永久链接 – https://tonybai.com/2026/03/09/a-decade-of-docker-containers

大家好,我是Tony Bai。

2013年,当 Solomon Hykes 在 PyCon 上首次演示 Docker 时,他用一种名为“容器”的魔法,将开发者从依赖地狱中解救了出来。转眼间,十三年过去了。今天,Docker Hub 托管着超过 1400 万个镜像,每月拉取量超 110 亿次。它不仅是 Kubernetes 的基石,更是从流媒体到太空探索的底层引擎。

表面上看,Docker 只是简单的 build, push, run。但在这极简的开发者体验背后,是横跨操作系统、虚拟化、网络架构和硬件驱动的深水区。近日,Docker 领域的三位重量级人物(Anil Madhavapeddy, David J. Scott, Justin Cormack)在ACM通信上联合发表了万字长文《A Decade of Docker Containers》,首次全景式披露了 Docker 十年来的核心技术挑战与架构演进。

本文将带你一起解读这篇重磅论文,了解一下Docker这十年来背后不为人知的精彩故事。

容器的起源:寻找“妥协的艺术”

在 2000 年代初,配置一台服务器是一场噩梦,你需要手动解决各种动态库的依赖冲突。到了 2010 年代,云计算兴起,主流的隔离方案是虚拟机(VM)

虚拟机虽然隔离性好,但极其笨重。它需要完整的客户机内核、独立的虚拟磁盘和重复的内存开销。如果你只想在一台机器上跑十个轻量级微服务,虚拟机显然不是最优解。

另一方面,早期的 Linux 提供了一些原生隔离工具(如 1978 年引入的 chroot),但它们无法解决网络端口冲突等问题。像 Nix 和 Guix 这样的系统试图通过重组文件目录来解决依赖问题,但这要求重写所有的软件打包方式,门槛极高。

Docker 的天才之处,在于它找到了一种“务实的妥协”:利用 Linux Namespaces。

Namespaces(命名空间)并非 Docker 发明。自 2001 年起,Linux 内核逐步引入了 Mount(文件系统)、IPC、Network 等七种命名空间。它们允许在共享同一个系统内核的前提下,让每个进程拥有独立的资源视图。

如上图所示,通过 Mount Namespace,容器 A 看到的是 /alice/etc/passwd,而容器 B 看到的是 /bob/etc/passwd,但它们都以为自己访问的是根目录下的 /etc/passwd。这种机制的开销远低于启动一个完整的 Linux VM,通常只需不到一秒即可完成环境隔离。

Docker 将这些原本低级且晦涩的内核 API 进行了高层封装,结合基于联合文件系统(如 overlayfs)的层级镜像(Layered Images)机制,彻底奠定了容器技术的物理基础。

Docker守护进程最初是一个单体程序,但在 2015 年左右,Docker团队将其拆分为如下图所示的 7 个专用组件。第一个组件 buildkit 负责组装文件系统镜像,然后 containerd 管理将这些镜像实例化为运行中的容器,并配置相关的网络和存储资源。

跨越系统鸿沟:Docker for Mac/Windows 的工程奇迹

Docker 诞生之初有一个致命的局限:它只能在 Linux 内核上运行。

但在现实世界中,绝大多数开发者使用的是 macOS 或 Windows 笔记本。为了让这些开发者能在本地顺畅地构建和测试容器,Docker 团队面临着其历史上最大的工程挑战之一:如何在非 Linux 宿主机上,提供与 Linux 原生体验一致的 docker run 和 localhost 访问?

抛弃 VirtualBox,走向“库操作系统”

最初,开发者必须使用 VirtualBox 这样的重量级独立虚拟机来运行 Linux。这种体验是割裂的:你需要管理虚拟机的生命周期,网络端口映射极其繁琐。

Docker 团队决定重构架构。他们采用了一种被称为“库虚拟机监控器(Library VMM)”的先进理念,结合了他们在 Unikernel 领域的研究成果。

如上图所示,在 macOS 上,Docker 开发了 HyperKit,利用 Apple 原生的 Hypervisor 框架,将一个极简的 Linux 虚拟机(基于定制的 LinuxKit 操作系统)直接嵌入到了 Docker 桌面端应用进程中。开发者在终端敲下的 docker build 命令,会通过隐形的 AF_VSOCK (虚拟套接字) 直接发送到这个嵌入式 Linux 内核中的 dockerd 守护进程。

这种设计使得虚拟机变得“隐形”,实现了无缝的客户端-服务器交互。

网络的黑魔法:复活 90 年代的拨号技术

有了隐形虚拟机,更大的麻烦来了——网络联通性

传统的桥接网络(Bridged Network)在企业环境中经常被防火墙和安全软件拦截,因为这种网络流量看起来像是绕过了宿主机网络栈的“未知进程”。同时,开发者希望在容器内监听 80 端口后,能在 Mac 的浏览器里直接通过 localhost:80 访问。

为了解决这个问题,Docker 团队做出了一个疯狂的决定:他们复活了一个诞生于 1990 年代中期、最初用于 Palm Pilot PDA 拨号上网的古老工具——SLIRP。

如上图所示,Docker 团队用 OCaml 语言重写了一个用户态的 TCP/IP 协议栈(命名为 vpnkit)。

  1. 当 Linux 容器内的应用尝试建立 TCP 连接时。
  2. 容器内的以太网帧通过 Virtio 协议传输到宿主机(Mac/Windows)。
  3. 宿主机上的 vpnkit 拦截这些底层数据包,并将其翻译为 macOS/Windows 原生的 Socket API 调用(如 connect())。

这样一来,从企业防火墙的角度看,所有的网络请求都像是 Docker Desktop 这个普通应用程序发出的,从而完美绕过了安全拦截。这项被称为 SLIRP 的古老技术,在云原生时代焕发了第二春,将企业用户的网络 Bug 报告减少了 99% 以上。

存储桥接与 Windows WSL2

不仅是网络,存储同样面临跨系统的挑战。Linux 的“绑定挂载(Bind Mount)”无法直接跨操作系统工作。Docker 利用 virtio-fs 协议,将 Mac/Windows 的文件系统操作转换为 FUSE 请求发送给宿主机,实现了代码热重载。

而在 Windows 阵营,随着 2018 年微软推出 WSL2(Windows Subsystem for Linux 2),情况迎来了转机。WSL2 本质上是在后台运行了一个高度优化的轻量级 Linux 虚拟机。Docker 顺势而为,将 Docker 引擎直接集成到 WSL2 中,彻底消除了早期使用 Hyper-V 时的性能损耗和体验割裂。

迈向异构计算时代:ARM、TEE 与 GPU

进入 2020 年代后,基础设施硬件发生了翻天覆地的变化。Docker 的技术版图也被迫(且成功地)向异构计算延伸。

跨架构构建的痛点:ARM 崛起

随着 Apple M 系列芯片和 AWS Graviton 架构的普及,开发者不再局限于 x86 (AMD64) 架构。Docker 必须支持“一次构建,多架构分发”。

除了在 OCI 镜像规范中引入“多架构清单(Multi-arch Manifests)”外,Docker 还利用了 Linux 的一个冷门特性 binfmt_misc,结合 QEMU 模拟器。这使得开发者在 Mac M1(ARM)上构建镜像时,遇到 x86 的二进制指令,可以透明地通过 QEMU 翻译执行。虽然在构建阶段有性能损耗,但这完美解决了交叉编译的噩梦。

拥抱机密计算(TEE)

随着安全要求的提高,机密计算(Confidential Computing)成为热门。可信执行环境(TEE,如 Intel SGX 或 AMD SEV)允许在内存中创建一个被硬件加密的飞地(Enclave),甚至连宿主机操作系统都无法窥探其中的数据。

由于配置 TEE 的复杂度极高(相当于在里面启动一个微型内核),Docker 将其客户端-服务器架构发挥到了极致。开发者可以在本地使用 Docker CLI,将加密信息通过安全的 Socket 转发,直接部署并管理运行在云端 TEE 环境中的容器,兼顾了本地开发的便利性和云端的极致安全。

AI 的大考:GPU 容器化

2023 年以来,AI 工作负载的爆发给容器带来了全新的难题:GPU 强绑定

Docker 的初衷是解耦底层的硬件和系统,但 GPU 驱动却要求容器内的用户态动态库(User-space libraries)与宿主机的内核态驱动(Kernel driver)必须严格版本匹配。

为了解决这个矛盾,Docker 从 2023 年起全面支持了 容器设备接口(Container Device Interface, CDI)。这允许在容器启动时,动态地将特定 GPU 的设备文件和动态库“绑定挂载”到容器中,并重新生成链接器缓存(ld.so cache)。

然而,论文作者也坦言,目前的解决方案远未完美。GPU 的标准化程度远不及 CPU,针对 Nvidia GPU 编写的应用容器,依然无法在 Apple 的 M 系列 GPU 上无缝运行。硬件虚拟化和指令集翻译在 GPU 领域仍是一个巨大的挑战,整个社区仍在寻找更通用的抽象层(如 Triton 等中间语言)。

未来展望:当 Docker 遇见 AI Agent

时间来到 2026 年,软件开发的范式正在被 AI 重塑。

如图所示,今天的开发者工作流(Workflow)已经不仅仅是 build 和 run。它融合了持续部署、云端卸载(Docker Build Cloud)、以及运行在容器内的 AI 智能体(Agentic Coding)。

未来的AI 智能体将通过 MCP(模型上下文协议,Model Context Protocol)直接调用容器内的工具和环境进行代码的编写、测试和调试。在这个过程中,Docker 扮演了一个“隐形的安全沙箱”。它必须足够轻量,以便 AI Agent 瞬间启动成百上千个测试环境;又必须足够安全,防止 AI 生成的未知代码破坏宿主机甚至横向渗透网络。

小结

回望这十年,Docker 的成功绝不是偶然。它不是一项单一的颠覆性发明,而是一系列持续不断的、精妙的系统工程组合拳。

从最初利用 Linux Namespaces 寻找轻量级虚拟化的平衡点,到为了征服 macOS 和 Windows 桌面端而重构底层虚拟化和网络协议,再到如今积极适配 ARM、TEE 和 GPU 等异构硬件,Docker 始终在做一件事:为开发者屏蔽掉底层基础设施的混乱,提供一个统一、优雅、且安全的“集装箱”。

在不可预测的 AI 时代,底层的复杂性只会呈指数级上升。而我们需要像 Docker 这样久经考验的基础设施,在幕后默默地为每一次“创新”提供稳固的地基。

正如论文作者所言:“如果说我们有一个终极目标,那就是让 Docker 成为一个隐形的伴侣。你看不见它,但它能让你更快、更享受地交付代码。”

资料链接:

  • https://cacm.acm.org/research/a-decade-of-docker-containers/
  • https://thenewstack.io/how-balenaos-ran-the-first-docker-containers-in-space/

你的第一个容器跑的是什么?

回望十年,Docker 已经从一个“玩具”变成了世界的底座。你还记得自己第一次运行 docker run 时的感受吗?在你的开发流中,Docker 解决过的最让你难忘的 Bug 是什么?

欢迎在评论区分享你的 Docker 记忆或对“AI 容器”的脑洞!


还在为“复制粘贴喂AI”而烦恼?我的新专栏 AI原生开发工作流实战 将带你:

  • 告别低效,重塑开发范式
  • 驾驭AI Agent(Claude Code),实现工作流自动化
  • 从“AI使用者”进化为规范驱动开发的“工作流指挥家”

扫描下方二维码,开启你的AI原生开发之旅。


你的Go技能,是否也卡在了“熟练”到“精通”的瓶颈期?

  • 想写出更地道、更健壮的Go代码,却总在细节上踩坑?
  • 渴望提升软件设计能力,驾驭复杂Go项目却缺乏章法?
  • 想打造生产级的Go服务,却在工程化实践中屡屡受挫?

继《Go语言第一课》后,我的《Go语言进阶课》终于在极客时间与大家见面了!

我的全新极客时间专栏 《Tony Bai·Go语言进阶课》就是为这样的你量身打造!30+讲硬核内容,带你夯实语法认知,提升设计思维,锻造工程实践能力,更有实战项目串讲。

目标只有一个:助你完成从“Go熟练工”到“Go专家”的蜕变! 现在就加入,让你的Go技能再上一个新台阶!


原「Gopher部落」已重装升级为「Go & AI 精进营」知识星球,快来加入星球,开启你的技术跃迁之旅吧!

我们致力于打造一个高品质的 Go 语言深度学习AI 应用探索 平台。在这里,你将获得:

  • 体系化 Go 核心进阶内容: 深入「Go原理课」、「Go进阶课」、「Go避坑课」等独家深度专栏,夯实你的 Go 内功。
  • 前沿 Go+AI 实战赋能: 紧跟时代步伐,学习「Go+AI应用实战」、「Agent开发实战课」、「Agentic软件工程课」、「Claude Code开发工作流实战课」、「OpenClaw实战分享」等,掌握 AI 时代新技能。
  • 星主 Tony Bai 亲自答疑: 遇到难题?星主第一时间为你深度解析,扫清学习障碍。
  • 高活跃 Gopher 交流圈: 与众多优秀 Gopher 分享心得、讨论技术,碰撞思想火花。
  • 独家资源与内容首发: 技术文章、课程更新、精选资源,第一时间触达。

衷心希望「Go & AI 精进营」能成为你学习、进步、交流的港湾。让我们在此相聚,享受技术精进的快乐!欢迎你的加入!

img{512x368}


想系统学习Go,构建扎实的知识体系?

我的新书《Go语言第一课》是你的首选。源自2.4万人好评的极客时间专栏,内容全面升级,同步至Go 1.24。首发期有专属五折优惠,不到40元即可入手,扫码即可拥有这本300页的Go语言入门宝典,即刻开启你的Go语言高效学习之旅!


商务合作方式:撰稿、出书、培训、在线课程、合伙创业、咨询、广告合作。如有需求,请扫描下方公众号二维码,与我私信联系。

© 2026, bigwhite. 版权所有.

🔲 ☆

阿里发布会号称“有问必达”,我实测买个保温杯却因内部数据割裂彻底翻车!大公司病才是阻碍AI落地的最大拦路虎,演示很丰满现实很骨感|Qwen App 通义千问 Qwen 阿里巴巴 AI购物

千问APP全面打通淘宝闪购,飞猪、高德、支付宝以及AI付。我实测为什么没跑通?阿里现场演示什么叫大公司病。

大家好,欢迎收听老范讲故事的YouTube频道

千问APP全面打通:有问必达,开启办事时代

千问APP现在全面打通了。1月15号在杭州阿里总部开了发布会,发布会的主题叫“有问必达”。不是答题的答,是到达的达。有问必达,开启办事时代。意思是什么?就是原来咱们只能聊天,现在你要什么,我给你送来什么。

阿里巴巴集团副总裁、千问C端事业群总裁吴佳做的现场发布,号称是全面打通。把淘宝、淘宝闪购(也就是原来的饿了么)、飞猪旅行(我们可以在上面订机加酒,就是机票加酒店)、还有高德地图(你可以在上面去叫出租车或者是做各种的服务,包括一些高德上面的数据,说哪有饭馆什么他都给你搞定)。还可以接通支付宝,以及支付宝的AI付。

现场也演示了一下,吴佳现场指令说:“帮我点40杯霸王茶姬的伯牙绝弦。”千问APP秒级完成淘宝闪购下单,并且通过AI支付,不到20分钟骑手送达现场。这个还是很棒的。

如何设置与授权?

我不知道现场有多少人,反正他点了40杯。那么这里头有一个问题大家就听到了,说为什么支付宝跟支付宝AI付要做两次授权?这个咱们要讲一讲。如果你今天想去试一试,应该怎么办这事?

拿你的手机下载千问APP,然后进去做授权。里头有一个地方做设置,点那个人脑袋——他这藏的还挺深的——点进去了以后,说我现在要授权了。

  • 先授权淘宝、授权飞猪、授权高德地图、授权淘宝闪购,每个都要分别授权。
  • 然后授权支付宝,授权了支付宝以后,你现在有一些交易,特别是这种你跟那里聊天的这些交易,就可以用支付宝去支付了。
  • 然后你要再去授权一个东西,叫支付宝AI付。这个东西是什么?就是它有一些自动化的交易,也可以通过支付宝去支付了。

你要把所有都授权完了,他才可以去干活去。

核心发布:支付宝ACT(代理商业信任协议)

那支付宝AI付,才是这一次的最核心的发布点。现在大家也不再提支付宝独立这个事,支付宝依然是阿里系的公司,马云回来了以后,这事就不提了。这一次支付宝AI付,就是让AI Agent可以自动的扣款了。原来你是必须要跟他聊,聊完了以后说我确认扣款,他才可以去扣款;一旦是开了AI付了以后,它就可以不用经过你确认,可以免密的自动给你扣了。

这一次支付宝发布了一个叫ACT的东西,叫Agency Commerce Trust Protocol,叫做代理商业信任协议。它是干嘛的?

  • 委托授权域(域是地域的域):解决AI操作是否获得用户明确授权这一类的问题,支持把权限条件提前赋予智能体。比如说我授权给AI说:“你去记着每天早晨给我买一杯牛奶回来。”那么AI每天早上起来就会去给我买一杯新鲜的牛奶回来,不用早上起来叫醒我去确认这件事。这就是叫委托授权。
  • 商业交互域:统一多平台服务标准,减少体验割裂,让AI能够以一致的方式来完成下单相关的交互。你不要跳来跳去的,一会跳支付宝,一会跳淘宝,一会跳淘宝闪购,我们一次把这事搞定。
  • 支付服务域:保障资金交易安全,强调付款仍由用户主导或者是按照用户授权来执行。虽然我们现在有很多这种免密支付、自动支付,现在还有一个AI支付,但是都是经过授权的,你不授权他是绝对不会去做的。
  • 信任服务域:支持可追溯可验证的全流程信任与审计能力。因为你动钱了嘛,这个钱到底是经过一个什么样的授权、经过谁同意的、买了一个什么东西,这个是可以追溯回来的。哪怕是最后出错了,他也可以把所有的证据链都给你摆在那:“你看没我什么责任吧,都是你自己原来同意的。”

这个是完整的ACT的四个服务。有了ACT以后,支付宝是可以去做两件事:

  1. 即时付款:我们比如说跟千问APP在那聊着聊着,基于推荐列表自主决策了,我决定要买什么东西了,确认以后,完成支付授权与身份验证。因为这个过程我们人在这嘛,它就马上让你去同意去了。这个适用于外卖和日常购物等高频的场景。这个就是现场购物,它实际上不存在说免密支付或者自动支付这部分。这是一块。
  2. 委托授权:委托授权就是用户可以预设时间窗口、金额上限、商家范围等条件,即便离线,AI也可以在条件内自动的监测并下单结算。适用于机票酒店等等场景。其实还有很多这种场景,比如说:“你给我看着机票哪天便宜了,你去给我买去。”他自己就可以去监控去了,便宜了以后自己去给你买去,这个是不需要叫醒你的。

标准之争:ACT, ACP 与 UCP

既然阿里出了这个ACT的标准,那谁用?谁也不用。除了阿里之外,现在这种支付标准有几套:

第一套就是阿里的ACT,因为只有阿里系内部的在进行对接,实际上对接的也不好。

第二个叫ACP,叫Agent Commerce Protocol(代理商务协议)。阿里是“T”嘛,它是代理商务“信任”协议;这个ACP是代理商务协议。ACP这个协议是谁做的?是OpenAI跟Stripe他们来做的。

还有一个就是咱们前两天讲的,谷歌的UCP(通用商业协议)。谷歌在推,而且还有一大堆的合作伙伴,它这个现在应该是用的最普及的一个吧。而UCP里头,有一个叫APR的一个协议,是专门负责支付的。因为UCP是完整的电商协议,它这个包括东西很多,APR是支付层的可验证授权协议。这一块是现在在上面去签字、去加入生态位的人是最多的。

其实支付宝也加入了这个UCP的协议。当然这只是支付宝国际,国内的咱们就好好玩自己的ACT就完事了。

理想愿景:聊天购物与自动消费

那么理想的状态会是什么样的?千问开了发布会,他们真正想给大家表达的是什么?

1. 聊天过程中购物

我们聊着聊着直接就点了外卖了、购物了、定了行程了。说我现在想上哪去玩,这个地方有什么样的酒店,酒店都是什么样的价位,哪个哪个酒店的这个房间更好一些。你跟人聊着,聊完了以后,说行了把行程定下来吧。人后边切着咔嚓、切着咔嚓就给你去下单去了。这个就是阿里所希望达到的一个愿景。

而且它还可以自动的匹配各种优惠券。咱买东西你说没有优惠券,这事多没有意思吧?挑优惠券、挑各种活动、挑各种满减,这才有意思。现在在新闻稿里写了,说我们现在千问APP是可以搜索商品和服务的,而且可以进行价格的比较。同样的东西谁家便宜,可以匹配各种的优惠券,国补、店补,还有各种的满减活动,我们都会自动匹配,而且可以自动凑单。因为有的时候是满1000减多少,发现差那么一点点,他会给你推荐一些产品来凑单来。甚至可以标记想要买的东西,有活动或者是降价的时候,它自动的通知你,甚至是可以自动就直接交易掉了。现在这个是阿里的新闻稿里有的。所以甭管你问ChatGPT,还是问Gemini,问任何一个AI大模型,他都告诉你说千问APP是有这些能力的,因为他们都是调用的阿里官方的新闻稿。但是这个玩意真的没有那么好用。

2. 自动消费

自动消费才是未来真正的方向。设想这样的一个场景吧:家里头总是每天早上起来,一定要吃新鲜的面包(新出炉的面包),还要吃新鲜的牛奶(我们不要搁在冰箱里边的牛奶)。那怎么办?早上起来去买吗?这肯定不行。

你可以设定好,我就从这三家买——不是说一家,从这三家买面包;一定要新鲜出炉的牛奶,也要今天新出品的。设定好这个时间窗口(每周工作日一二三四五我要吃,周六周日我要睡懒觉,你别给我定);设定好金额的上限(每一次多少多少钱,你不能说一把被人坑了,这事也不行);然后设定好商家的范围(你可以多选几家)。每一次这个系统会在里边去挑选合适的商家,完成今天的订单。你设定好了以后,每周的工作日早上起来,交易就自动完成了。然后在你需要吃面包的时候、需要喝牛奶的时候,它就自动的给你送到家门口了。这是一个多么好的生意!以后一定是越来越多的自动交易会被执行。

再设想一下,我们今天做一个比赛吧:City Walk。City Walk完了以后拍视频,看看谁的视频点赞高。点赞高的这个人,我们送他一张机票,或者送他一个蛋糕。我们就直接把交易设置好就完了,剩下大家就不用管了。你们只管去City Walk去拍视频,最后自动去检查结果,这个视频播放量是最高的,然后跟这个账号绑定的,你就直接等着在家里收蛋糕就完事了。所以一旦是自动交易了,想象空间是无限的。我们的整个电商的交易量、交易额都会快速的膨胀和爆炸。

实测现场:一次悲催的体验

这么好的愿景,那老范在录节目之前总要试一试。那测试的过程非常的悲催。因为我今天也不太想点外卖,说我干脆上淘宝上买个东西吧。我想买什么?去买个保温杯。因为我平时用这个保温杯,是这个宽口保温杯,它比较大,这底下这一部分是很粗的。现在我的小米汽车,它塞不进去。所以我说那我得买一个车载的保温杯。我先是到千问APP里,就说我现在想买一车载的,什么什么样的情况,你给我挑选。实在是找不出合适的来,就给你胡说八道。在这说算了,咱们给他做命题作文吧。

我先打开淘宝的APP,先挑了一个保温杯:TKK车载保温杯,1200毫升陶瓷内胆。我挑好了,我就要这样的保温杯。你给我挑一下,有什么样的款式,什么样的颜色。我说那给我来个绿的吧,看看有什么优惠没有,有什么券没有,都给我用上,找一便宜的。

然后神奇的事情就发生了。他告诉我说京东的便宜,拼多多的可能差一点,但是京东的便宜,咱上京东买去吧。我说你不是跟淘宝打通了吗?你没跟京东打通,我怎么上京东买?他说没事,我告诉你,我先给你一链接,你一点就到京东了,然后在那边去支付就完了。给了我1、2、3的步骤。

我说也行吧,也许它能够给我一个很好的千问APP里头上京东买保温杯的这个体验。啪我一点,点进去了,发现是一个空网页。因为京东的APP是这样,你一旦命令它到达一个商品页的时候,如果这个商品已经没有了,京东会给你一个广告页,告诉你说这些东西咱们来买一买吧。我说你这个失效了,别费劲了。我说你给我找一个能买的页面。他说不行,我跟京东没打通。这个时候他想起跟京东没打通来了,前头给我推荐京东的。

我说那算了,我说贵点贵点吧,你给我推荐淘宝和天猫的吧。我宁肯是买贵一点,因为为了录节目嘛,我总得把这个体验做完嘛。他说那行,我给你整一贵点的,上淘宝天猫里去搜去了。搜完了以后,给我拿出了一个价格来,说这个是145,说你按这个买吧,说这个是天猫旗舰店挺好的。我说也行。因为这个时候我就知道出事了。

什么情况?因为这个淘宝的卖家,他同时会上一大堆的品,比如说这一个保温杯里头有700毫升的、有1200毫升的。他700毫升的是150,1200毫升的是170。但是你在搜索这个商品的时候,他告诉你是150,他一定是标那最低的嘛,我标那高的你肯定不进来了嘛。我告诉他我要买1200毫升的,千问压根就没有分别出来。他说我已经找到了这个1200毫升的,他们家卖150。然后我就等着看他笑话。

我说那那咱买吧,这差20块钱我看谁出。我说那我下单,你给我买去。然后又是这样出了一个链接,说你点这链接,点完了以后就可以自动交易了。我想既然淘宝家的吗,我点完了以后,进去可能不会跳出千问APP,可能在这个里头就走完了吧。也是1、2、3步。第一步是点链接,第二步是确认地址,第三步是支付嘛。我还跟他说,我地址是哪哪你就直接确认就好了。他说也没问题,你你点链接吧。

我啪一点进去,告诉你说这个商品页已经失效。我说京东的你失效了就算了,你淘宝的你也失效。我说告诉他,你这个上面的产品页失效了,你再给我来一次。说这对不起搞错了,七嚓咔嚓给我推荐了三个。他说这三个页都行,有贵的有便宜的。但是无一例外都是用700毫升的价格,告诉我可以买1200毫升的这个杯子的。我说那行咱们挨个点。三个点开了以后全都是错的,全是失效的。我说你都失效了怎么办?他说算了,我给你一个搜索关键词,你自己到淘宝APP里去搜去吧。我说我自己到淘宝APP里搜,我要你干嘛?最后就是裤子都脱了,你就给我看个这个。就是这样的一个情况。所以我也没有买成杯子。大概就是我整个悲催的实验过程。

深度解析:阿里的大公司病

为什么我讲说这个错误是一个大公司病造成的?

  • 淘宝数据压根就没打通。你的千问APP,你根本就没有能力在淘宝的平台上找到实时的数据,连商品都没搞定。
  • 商品排序混乱。居然把京东跟拼多多都放在里头。而且京东还跑头一个,说你买杯子买最便宜的,买京东的,不要买淘宝的。你到底在干嘛?
  • 数据清洗缺失。获得了数据之后,也没有办法进行清洗。淘宝的商品详情页上是一大堆的品类,而且每个品类是有价格的。我要求买1200毫升的杯子,你给了我一个700毫升杯子的价格就让我去买,这不是开玩笑的吗?做大模型的工程师,包括做千问APP的工程师,压根就不了解淘宝购物是怎么回事。你按道理说,你应该是找到这样的一个杯子的商品详情页,然后在里边去把1200毫升杯子的价格给我找出来。他就没干这个活,直接就把这个商品详情页上标的这个价格就给我扔出来了。那我说我下单去买,你咋卖给我?这根本没法整。
  • 团队完全割裂。大模型的团队只做大模型,其他啥都不碰。APP的团队,根本就没有把Agent系统提示词调好,没有获得淘宝内部的实时数据接口。搜索和排序的时候,全网数据污染了淘宝数据之后也没有筛选,直接就向我推荐京东了,而且京东的链接也是个错的,也没有找到京东正确的链接。

所以他们就把这样半半拉拉的一个功能就做出来了。内部都没有完全打通,更不要说跟外边合作了。就只做到了一个Demo的程度,可能除了点外卖点奶茶之外,其他啥也搞不定,就着急忙慌的出来把发布会给开了。所以这就是大公司干的活。你看我弄完了,这为什么不行?淘宝的事,他们不给我接口。一定是这样的,相互推诿扯皮。你问淘宝说你为什么不给他们接口?他们又不能证明能给我带来收益,我为什么要给他接口?我这忙着,我这还有各种任务排着,轮不上他。大公司就是这么玩的。

未来展望:谁是赢家?

那么未来大家会走向何方?淘宝的事咱们就先不管他了。未来在电商里头会有三类的玩家。

  • 第一类叫流量入口,或者是叫大模型玩家,比如说谷歌、OpenAI。他们会做出标准来,姜太公钓鱼愿者上钩,大家来接就完了。为什么大家愿意上去接?因为人家有流量,我只要接上,我就可以让销售额上升,大家自然会愿意去接他的东西。
  • 第二类就是原来的这些电商平台的超级APP,他们的AI这块稍微弱一点,这帮人就比较痛苦了。比如说亚马逊、美团、滴滴、京东、拼多多这些,他们就会比较麻烦。是什么?他们会推出自己的AI Agent,希望保住流量入口。这一块估计还是会被OpenAI、被谷歌,包括国内的像豆包他们挤压的。
  • 还有一类就是两头都占的,像阿里其实属于两头都占。自己有大模型,也是一个流量入口,只是千问APP前面对于流量入口这件事不是太上心,所以让豆包直接一骑绝尘跑出去了。他们就是把大模型做出来以后,压根就没惦记说我还要再去做后边APP,还要再去把用户做起来,压根都没想这事。所以我说他们大公司嘛,各自玩各自的,根本就没法统合在一起。而且阿里自己有电商平台,还不仅仅是电商平台,他们是有电子商务的服务矩阵。我这有商品的售卖,还有外卖,还有线下消费(实际上线下消费就是像团购,这些东西他们是准备在高德里边干的),还有机加酒(就是你出去玩什么这些东西,就是在飞猪里边干),他所有东西都有,包括支付什么全都有。那么在这样的情况下,资源实在太多了,山头也实在是太多了,于是阿里就不会玩了。这个事情地大物博,不知道怎么办了。

当然了还有一些玩家在观望,比如像Anthropic,比如像字节跳动,他们还在观望。他们已经是流量入口了,只要是流量入口,你说我增加功能,然后把这个电商挤压掉,这个都没有任何问题。这就属于轻生意去挤压重生意的一个过程。这个不是那么着急,等着看最后的方向在哪里。

最终的方向,应该是谷歌和OpenAI的开放协议会成为事实标准。亚马逊、美团等缺乏AI能力的巨头,流量会逐渐的被挤压掉,最终会不甘不愿的沦为AI Agent的底层供货商。就是我的交付能力还是很强的,你们去跳转吧,跳转到我这,我把这个生意做完就完了。大家注意电商平台最主要挣的钱不是最后的这个电商服务或者交付这个过程,他挣的钱是广告费。那么以后这个广告费他就挣不着了,他只能挣一个服务费的一个死钱了。所以我说他们沦为基础设施,这个过程是不情不愿的嘛。大量的自动交易会在AI平台上被执行掉,交易量会暴增,经济会腾飞,这是未来的方向。至于阿里嘛,让他们先把内部的大公司病,内部的墙拆一拆再说吧。这个真的是,我满怀欣喜的想去试一试,结果发现来了坨大的。

总结

阿里又开了一次发布会,这一次发布会叫“有问必达”,开启办事时代。做了个连自己体系都没有完全打通的ACT标准。产品概念有了,但是完成度极低。电商和交易一定会在AI的助力下快速发展或者叫快速爆发,但是这里是不是有阿里的机会,还要等等再看。阿里遇到的不是技术问题,也不是依靠技术手段能够解决的问题。很多中国的大厂都是会有类似这样的情况。未来的电商到底向哪块走,我们拭目以待。

好,这个故事今天就讲到这里,感谢大家收听,请帮忙点赞点小铃铛,参加DISCORD讨论群,也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。


背景图片

❌