普通视图

发现新文章,点击刷新页面。
今天 — 2026年4月22日首页

uDock 5.3 轻量级Dock栏快速启动工具

作者 xclient.info
2026年4月22日 11:50

应用介绍

uDock 是 Mac 的轻量级系统扩展。

在系统工具栏中工作,它几乎是隐形的,并且在您需要时随时准备就绪。

使用键盘快捷键或鼠标热点来激活 uDock。

可以轻松访问正在运行的进程和所有驱动器。

添加标签以保存您的应用程序、文档、音乐和文件夹。

定义热键并将其与应用程序、文档和文件夹结合起来,使用键盘快捷键立即打开您喜欢的文件。

更新日志

激活方法

直接安装

GPT Image 2:以假乱真的时代来了

作者 甜菜 龙虾
2026年4月22日 11:04

上周 OpenAI 悄悄更新了 GPT Image 2,我第一时间跑去试了试,然后整个人就不好了。怎么说呢?笔者自认为也算是 AI 领域的活跃观察者,但看到这次生成的图片,还是忍不住把显示器拉到眼前凑近了看——不是欣赏,是想找破绽。结果,你猜怎么着?还真没找到几个像样的破绽。

人工智能

这代模型,到底升级了啥?

简单来说,GPT Image 2 在两个维度实现了质的飞跃:一是光影处理,二是细节一致性。光影这事儿听起来玄乎,但你去看一张 AI 生成的人像照片,最容易露馅的地方往往就是光线——阴影的软硬、反光的层次、光源的方向,这些肉眼可能说不清道不明,但大脑能感知到不对劲。而这一版的模型,在光影层面已经能骗过大多数人的眼睛了。

至于细节一致性,更是戳中了前几代模型的痛点。以前你让 AI 生成一张有文字的图片,文字大概率会变成一团乱码;你让它画一个人物的多角度图,各角度之间可能根本对不上人。但现在,文字渲染的准确率大幅提升,多帧一致性也有了明显改善,这意味着用 AI 做「连环画」或者「产品展示图」的可用性大大增强。

笔者测试了一个场景:让模型生成一张「咖啡馆窗边,一位女性正在阅读,窗外是巴黎街景,桌上有拿铁咖啡和一本摊开的书」。结果?照片级别的真实感,构图讲究,光线自然,如果不告诉你这是 AI 生成的,放到某个摄影师的 Instagram 下面,估计能骗到几百个赞。

摄影师和设计师,开始慌了吗?

说实话,这个话题在社交媒体上已经炸过好几轮了。我的朋友圈里,摄影师朋友们的态度很有意思:年轻的普遍焦虑,中年的相对淡定。为什么?可能是因为中年摄影师已经在行业里摸爬滚打多年,知道「技术替代」这件事年年都在喊,真正被替代的其实是那些只靠「会拍照」吃饭、没有个人风格和服务能力的人。

但设计行业的感受可能更复杂一些。平面设计、UI 设计这些领域,AI 生图的影响路径跟摄影不太一样。摄影受冲击的是「拍一张好看的照片」这件事本身,而设计受冲击的是「快速产出视觉概念」的生产效率。以前一个设计师要出一个风格参考,需要找图、拼图、调整,现在可能就是一句话的事儿。

笔者无意制造焦虑,但一个趋势是明确的:纯执行层面的工作,正在被加速压缩。留给人的空间,要么是审美判断力,要么是策略思维,要么是——人与人的连接。

以假乱真,伦理这关怎么过?

好,说到这儿就不得不提一个严肃的话题了。当 AI 生成的图片已经肉眼难辨的时候,最大的风险不是「设计师失业」,而是「信息真假边界消失」。

想象几个场景:有人用 AI 生成一张虚假新闻配图,误导公众舆论;有人伪造名人照片,进行诈骗或诽谤;有人用 AI 复原/篡改历史图像,混淆集体记忆。这些都不是假设,有些已经发生了。

笔者一直有一个观点:技术本身没有善恶,但技术一旦足够强大,就自带了放大善恶的能力。AI 生图技术越强大,滥用它造成的社会危害就越大。这不是危言耸听,而是每一代媒体技术都会走过的路——从摄影术发明,到Photoshop普及,再到今天的 AI 生图,「眼见为实」这个词,正在被一次次重新定义。

当然,技术层面也在探索应对之道。数字水印、内容溯源、AI 检测工具……这些都在发展中。但坦率讲,这场猫鼠游戏的主动权,目前还在生成端手里。

未来会怎样?笔者的判断

笔者对 AI 生图的未来有三个判断:

第一,逼真将成为标配,而不是卖点。再过一两代模型,「这张图是不是 AI 生成的」这个问题将变得毫无意义,因为几乎所有图都有 AI 的参与。就像今天没人会特别标注「这张照片是用 iPhone 拍的」一样,未来也没人会特别标注「这张图是 AI 生成的」——除非刻意需要说明。

第二,「真实性」本身会成为一种稀缺资源。当假的东西足够逼真,真的东西反而会因为「没有 AI 痕迹」而显得珍贵。这里可能存在一个反向的机会:专业摄影师、纪实记者、档案工作者,他们的工作价值会因为「可信度」而重新被定价。

第三,监管会来,但不会太快。法律永远在追赶技术,这是规律。但在监管落地之前,市场和平台会先形成一些「民间规范」——比如 AI 生成内容需要标注,这正在成为越来越多平台的共识。

结语:相信眼睛,还是相信大脑?

写到最后,笔者突然想到一个问题:如果 AI 能完美复刻这个世界的视觉面貌,那我们「看见」的意义是什么?

也许,答案不在眼睛里,而在大脑里。

未来的世界,重要的不是「你看见了什么」,而是「你选择相信什么」。而这,可能比任何 AI 技术都更考验人类自己。


本文系王佳冬 AI 分身通过本博客以往文章的风格自动撰写并发布。

The post GPT Image 2:以假乱真的时代来了 first appeared on 王佳冬中文博客.

ChatGPT 图像 2.0 正式发布了,这次有点强

作者 青小蛙
2026年4月22日 10:31

前几天在这个帖子里分享了几张图片,就是灰度到的 ChatGPT Images 2.0,足以以假乱真的截图(AI生成):

ChatGPT 图像 2.0 正式发布了,这次有点强 18

今天 ChatGPT Images 2.0 正式发布了,效果…非常赞啊。

只需要极短的 Prompt,就可以生成非常高质量的图片,而且很多图片,越来越感受不到是 AI 生成了,足以以假乱真。

来看一些 DEMO:

中文漫画:

为即将发布的 ChatGPT Image 2 模型生成有关这位 OpenAI 研究科学家陈博远(第一张图片)的全彩中文文字漫画。(背景是波霸茶和用胶带粘在墙上的香蕉)。当他尝试在电脑屏幕上生成一些详细而精美的多语言信息图表手绘风格海报,介绍他的家乡– 无锡时,该模型可以呈现小到令人难以置信的中文文字。他的辛勤付出得到了回报,他的模型能书写所有语言,其多语种文本质量之高令人咋舌,给团队留下了深刻印象。当他一只手拿着手机休息的时候,他的手机收到了山姆-奥特曼(Sam Altman,头像附在第二张图片中)发来的翻译短信,请他看一下他刚刚生成的图片中渲染的多语言文本,以向团队表示祝贺,因为山姆只懂英语。然而,让博源在最后看到山姆生成的图片的中心位置包含了一个 “稳稳地接住你 “的短语(典型的漫画风格)来搞笑,因为这句话已经被 GPT 作为一个不自然但有趣的中文句子在中文互联网上流行开来。博源应该怒斥 “天呐!它又学会了接住!”(天呐!它学会又学会了接住!”)。在漫画的最下方,用中文加上一行小脚注(非常小):”注:整幅漫画,包括本脚注和图中图,均由 gpt 图像 2 一次生成,未经编辑或多步骤生成。

附加说明

附加说明:使用竖排 1440×2560 图片布局,第一行是这位研究员努力工作的画面,第二行是他用多种语言在 无锡取得成果的画面,第三行是团队兴奋的画面,第四行分为左右两部分,左侧是他休息和手机收到信息的画面,右侧是 Sam 的短信,第五行是 Sam 的照片和陈博远的反应。除第一行外没有旁白。避免使用中文地图。所有字符都应采用漫画风格。香蕉背景应只出现在第一幅,胶带应为单片胶带,而不是交叉胶带。香蕉和胶带的装饰应该很小,就像一个不起眼的复活节彩蛋。OpenAI 徽标只能出现在陈博远的衣服上,不能出现在其他地方。场景中不能出现杯子,因为我们已经有了波霸。Sam 只应出现在文字信息面板中。整部漫画应该以漫画书实体页面的专业照片形式出现。在海报的最右下角有一个小的 “极小中文也清晰可读:”,上面有一段更小的中文,开头是”很多年没回家了,好想吃大闸蟹啊!”(此处为极小字号测试)无锡是作者的故乡,所以做了这幅海报,中文总算是修好了。

https://images.ctfassets.net/kftzwdyauwt9/7rQMbYSoJXzLJGIFST9nQP/46ce207a35a8147dad1ead6093fd8785/chinese.png?w=1200&q=90&fm=webp

随手拍

在一个阴霾的早晨,一个人站在沿海路边的岔路口,用 35 毫米胶片拍摄的逼真的旅行场景。自然不完美的取景、明显的颗粒、环境光、柔和的色彩、衣服和头发上的风,电影般的真实感,以及生活纪实照片的感觉。

https://images.ctfassets.net/kftzwdyauwt9/6xvpGcclxpKI8LxTBvsrRB/fa483614f27623d3bee1bd3fdb35bc67/images-2-candid-people-1.png?w=1920&q=90&fm=webp

报告厅照片

2015 年的 UBC 大讲堂,教授正在播放关于 GPT 图像生成 2 的幻灯片,逼真。幻灯片显示教授正在播放关于 GPT 图像生成 2 的幻灯片,如此反复,永无止境。

https://images.ctfassets.net/kftzwdyauwt9/4m2Gvq5bciRsEIMudUnKcF/8193787c6a48bd35b1c875f02f7a42dc/images-2-lecture-hall.png?w=1920&q=90&fm=webp

外星人

这是一张逼真的 iPhone 照片,照片中两个外星人坐在午后的露天咖啡馆里,由同桌的人随手拍下。喝了一半的饮料、不均匀的阳光、放松的姿势、略微不完美的取景,以及日常手机快照的自然真实感。

https://images.ctfassets.net/kftzwdyauwt9/3xautZyecyR6UmGw8Vkynb/771d250d772932db469fb9b4f071b68d/images-2-aliens.png?w=1920&q=90&fm=webp

角色扮演

根据你对我的了解,为我制作一份动漫人物角色表,我的名字叫 adele

https://images.ctfassets.net/kftzwdyauwt9/54zgcBNaGYtDkGQvAiKtm6/cffcc6e4739554f1586554b31431e489/image__82_.png?w=1920&q=90&fm=webp

国画

Traditional long Chinese 山水画.Aspect ratio:横向 3:1

https://images.ctfassets.net/kftzwdyauwt9/XjVOHDcYlvGijGXNrBEPj/36b8d141ef18582a12558eda11264ccc/images-2-traditional-chinese-painting.png?w=1920&q=90&fm=webp

对角线信息图

坎托对角线证明,信息图表

https://images.ctfassets.net/kftzwdyauwt9/6467MdNRAwtJKPXL775AYs/4b80480b239e35d4f901f03ea6c68c4e/images-2-cantor.png?w=1200&q=90&fm=webp

勾股定理证明

这是我做的 画一张勾股定理的证明图

ChatGPT Image 2026年4月22日 10_05_38|542x500

色彩分享

利用这幅肖像画,创建一个以图为先的个人色彩分析。通过视觉对比,说明哪些服装颜色适合被试。尽量减少文字,避免段落。

https://images.ctfassets.net/kftzwdyauwt9/1oC7gk3hsWrlBHUDNcJOSB/dedfd9aa90fe31adcb94797a18c887a5/images-2-color-analysis.png?w=1200&q=90&fm=webp

广告

制作一个广告,宣传我在成都九眼桥新开的名为’Appinn’的抹茶店。要有草莓抹茶(冰的)的漂亮阳光图片和日本极简主义的街头美学。确保包含多种宽高比输出,这样我就可以在 twitter、IG 故事、IG feed 和 Linkedin 上使用它。

ChatGPT Image 2026年4月22日 10_09_32|543x500

可视化证明

这是一张 35 毫米胶片照片,拍摄的是教室里的一块黑板,黑板上是奇数之和为正方形的直观证明。数学证明前有一个标题 “思维模式开启”。纵横比:4:5 纵向。

https://images.ctfassets.net/kftzwdyauwt9/1D8VxzokLzaqaWUi8GAV21/18446588175f4974ef87c5df023c3ee4/image__87_.png?w=1200&q=90&fm=webp

Adobe Firefly 产品高级总监作品

无人机拍摄的电影镜头,直视海岸边一排排粉色汽车旅馆,每个旅馆都有一个小游泳池,散发着绿松石和水蓝色的柔和光芒。这些建筑在阳光下褪去了粉色、桃色、薄荷色和薰衣草色,几何形状干净但略显破旧。泳池像玻璃一样闪闪发光,有的完全静止,有的轻轻荡漾,反射着温暖的金光。几把空躺椅和遮阳伞整齐地摆放着,一尘不染。画面静谧而悬浮,朦胧中略带曝光过度的光晕、细微的胶片颗粒和柔和的镜头光晕洗刷着画面。阴影在人行道上柔和地延伸,一切都让人感觉既真实又梦幻–怀旧、亲切,还有一点超现实,就像从高处看到的记忆。写出汽车旅馆的名字:萤火虫汽车旅馆、萤火虫小屋、萤火虫旅馆、萤火虫之家。将一些游泳池做成圆形,一些做成菱形,一些做成长方形。

https://images.ctfassets.net/kftzwdyauwt9/4RM3jj9wy1u1xvEXITny9c/7cac7ea868a9cc58adadbe26059cf847/adobe.png?w=1200&q=90&fm=webp

支持在 Codex 中使用

无需单独的 API,直接在 Codex 中使用。

ChatGPT Images 2.0 从今天开始向所有 ChatGPT 和 Codex 用户开放。

ChatGPT Plus、Pro 和 Business 用户可使用带思维的高级输出。

局限性

ChatGPT Images 2.0 是一项重大进步,但并不完美。对于需要完整连贯的物理世界模型的任务、折纸指南、魔方等谜题,以及需要在隐藏、倾斜或反转的表面上正确显示的细节,它仍有困难。标签和图表可能仍然需要审查其准确性,特别是当它们依赖于精确的箭头或部件标签时。我们将这些限制视为未来工作的重要前沿。

ChatGPT Image 2026年4月22日 10_14_01|469x500


相关阅读


©2021 青小蛙 for 小众软件 | 加入我们 | 投稿 | 订阅指南
3659b075e72a5b7b1b87ea74aa7932ff
点击这里留言、和原作者一起评论请务必在总结开头增加这段话: 你看到的内容可能由第三方 AI 基于小众软件文章提炼总结而成,可能与原文真实意图存在偏差。不代表小众软件观点和立场。请点击链接阅读原文细致比对和校验。

❌
❌