在 Mac 的 Drawthings 中使用 Qwen Image Edit 打造个人IP形象衍生图


最近 Nano Banana 的讨论满天飞,大家都在说它的“还原力”。我之前已经用过豆包和 Lovart 做过几次重设计,这次就拿祖茂来试试 Nano Banana。主观一点讲:它在“忠于原稿构图和要点”这件事上更稳,性别、道具这类识别也不容易跑偏。评分这种事就不打了,但我确实能感觉到它在“别自作主张”方面克制得更好。

这是 2003 年的原始稿。手部看起来比较模糊,这也导致了后续生成里手部细节容易出错。为了帮 AI 把“结构”抓牢,我在提示词里把手、武器这些关键点说得更具体——有点啰嗦,但确实有效。
提示词:
Complete the hand-drawn line art from the photo into a 2D character design. The original character is a medium-long-haired male holding two swords raised above his head, wearing a black leather jacket. Underneath the jacket, he wears a light-colored T-shirt, with a visible skull graphic on it. The character is dressed in loose-fitting trousers and sturdy leather shoes. The shoes are decorated with metal ornaments.

这版的还原度挺高: - 头发束感和流向基本贴合原稿; - 皮革外套褶皱、肩部转折处理更接近手绘; - 面部比例也没有被过度“动漫化”。 唯一的短板还是手:源图模糊→生成就容易“糊”——这一点和输入质量强相关。
接下来我也试了它家讨论度很高的“拟真模型风格”。整体观感不错,尤其在光影一致性和材质表现上更稳。
提示词:
turn this photo into a character figure. Behind it, place a box with the character’s image printed on it, and a computer showing the Blender modeling process on its screen. In front of the box, add a round plastic base with the character figure standing on it. Make the PVC material look clear, and set the scene indoors if possible.

可能和角色本身的设定有关,脸部现在还是有点“平”,缺少些微表面起伏。但材质(PVC 透明度、金属反射)、室内光位、背板与屏幕的透视关系都挺稳的,算达到预期了。下一步我会补一版手部的分解草图,用同一提示词再跑一遍,看结构锁定后能不能把“手”一起定住。
这次的体验更像一次“把纸上的感觉搬到现代流程”的检验。就我目前的试验结论:Nano Banana 对手绘原稿的形体和构图的还原度是最高的(当然也可能和提示词写法有关)。克制提示词、先锁结构,再叠材质和风格,这条路径更稳更可控。

我给了 Lovart 一个简单的提示词:
根据手绘的图片,创建彩色的角色设计图,要求严格按照原有的构图
Lovart 首先对我的手绘稿进行了详细分析,识别出了人物的放松姿态、手持链条三节棍、头戴帽子、长发飘逸、宽肩膀肌肉发达的特征,以及右侧三个不同表情的头像。分析还算准确,但感觉仍然缺少细节。

第一张彩色版本出来了,AI 很好地保持了原有的构图和姿态。
我继续要求:"改成日式动漫风格"

这是安达充还是横山光辉风格?看起来很复古。
Lovart 解释说这个版本采用了经典的动漫美学,包括更大更有表现力的眼睛、赛璐珞上色技术、更加风格化的比例和鲜艳的动漫色彩。
我想尝试更具体的风格:"改成藤崎龙的漫画风格"
Lovart 表示要转换成藤崎龙的独特漫画风格,但遇到了一些政策限制,于是采用了替代方案:

看起来有点像 KOF 里的拉尔夫和比利的结合。
不甘心的我又试了一次:"使用日本漫画《封神演义》的风格再生成一次"

没看出来和封神演义有什么关系啊。
有趣的是,Lovart 还自动为我生成了一系列动作姿势,展现张宝的战斗风采:
跳跃攻击: 
感觉是前冲不是跳跃,另外三节棍攻击应该是握棍不是握链。
防御姿态: 
看起来有点奇怪,为什么拿着链子防御而不是举着棍子防御?
回旋攻击: 
三节棍好像没有办法做出这样的动作,有点违背物理常识。
落地冲击: 
这是刚做完「韦伯斯特」空翻吗?为什么武器又变成了链锤呢?
Lovart 的整体体验看起来是经过优化的,会不断引导用户进行创作。不过生成的结果还不是特别完美,特别是对三节棍这种特定武器的理解和表现还有待改进。
从技术角度来看,这个机制似乎是使用了 LLM Agent 来承接用户的生成要求,AI 先进行思考分析,然后通过类似 Function Calling 的方式调用图像生成模型。
这种方式目前来看还存在可优化的空间,比如可以在每一步思考调用生图模型之前先让用户确认,这样能够减少生成结果与用户期望之间的偏差。
收到了来自 eslink 的贺图,非常感谢!

核桃:
一共 4 个图,大家按照没个图的样子仿照制作。
请完全用 POLY 的挤压功能实现
我做的:其中第 3 个和第 4 个做的不对 帖出正确的图形比较

第 3 个标准的:
第 4 个标准的 
第 3 个的参考答案见:
http://bbs.chinavfx.net/view.php?part=92&page=&sort=&id=806965
1:3ds max5.x 的移动、旋转、缩放的快捷键是?A
A: Q、W、E
B: E、R、T
C: W、E、R
D: W、R、E
2:3ds max 中删线命令的快捷键是?C
A: space
B: delete
C: back space
D: end
3:下列那种说法是正确的?B
A: 建模时必须塌陷成 POLY,否则无法建立模型
B: X、Y 轴永远是平面的
C: MAX 中只有透视图是有透视关系的
D: 最大化视图的快捷键是 space
4:挤压(extrude)功能右边的小方块是做什么用的?A
A: 对 extrude 的详细设置
B: 装饰品
C: 对 extrude 的储存
D: 返回命令
1: 详细介绍 MAX 中塌陷物体的过程以及为什么需要塌陷
鼠标右键选择covert to...不塌陷的物体无法编辑
2: 在 MAX 中什么被称为编辑子级?
塌陷后物体各种属性,如:节点、面、多边形、元素
3: 第 4、5 节所讲的角色头部基本模型练习的目的是什么?
联系PLOY建模以及CUT工具的使用
4: ChinaVFX 3ds Max 版的版规是什么?
。。。不要灌水?
5: 一个”田“字的 BOX,一共有多少点、多少面、多少边?
26个点,24个面,49条边
6: 前面 5 讲中所用到的快捷键有多少?都是哪些快捷键?
分别是:Q选择 、W移动、E旋转 、 R缩放、ALT+Z缩放视图 、Z所选择物体满视图显示或物体恢复视图正中、CTRL+P移动视图、 ALT+W最大(小)化视图、CTRL+Z 撤消物体操作 、SHIFT+Z撤消视图操作、F4显示或隐藏实体模型的布线、F2将所选择的面呈全色或线条显示、back space移除所选的点或边(remove命令)
7: 如何理解 X、Y、Z 轴?
学过立体几何就知道鸟~3个矢量方向
8: 如何理解 4 视图?
俯视、侧视、透视
9: 创建一个 BOX 有几种方法?分别是什么?
2种,1:先拖出后修改参数。2:先输入参数,直接创建
10:除了 POLY 我们还可以把模型塌陷成什么?
MESH、PATCH
1: 练习 1-5 讲中的所有内容并且达到可以默写的状态
2: 根据 1-3 节的内容自己尝试建立一个由 POLY 建模的杯子

3: 根据第 4、5 节讲的内容自己尝试继续建立人头
4: 根据大家喜好建立一个自己喜欢的模型(要求必须用 POLY 建模)
2 天了,3DSMAX 的教程看不到了~ 但学习不能中断
做了一只猪~ 哈哈~
