精准控图!一个JSON模板让AI绘图100%听你的话
你有没有遇到过这种情况:明明脑子里有个超美的画面,输入AI绘图工具后,出来的却是"买家秀vs卖家秀"的灾难现场? 就像你跟理发师说"稍微修一下",结果变成了"从头再来"一样扎心… 问题出在哪?不是AI不行,是你的"提示词"说得太含糊了。 今天我就拆解一个能精准控制AI的JSON提示词模板,让gemini和豆包乖乖听话,生成抖音同款精修人像。 先看效果,有图有真相 这些图片都是用同一个提示词模板生成的。是的,你没看错,就是一个可以复用的"配方"。 为什么你的提示词总是翻车? 想象一下,你去星巴克点咖啡: 小白说法: “给我一杯咖啡”(结果:随缘,可能是美式可能是拿铁) 老司机说法: “大杯燕麦拿铁,半糖,多冰,extra shot”(结果:精准命中) AI绘图也是一样的道理。区别在于,你有没有掌握这套"专业黑话"。 所谓的"Prompt工程",说白了就是学会用AI听得懂的语言,把你脑子里的画面翻译出来。 6层结构,搭建你的提示词框架 我把提示词想象成搭积木,每一层都有特定的功能。就像盖房子,先打地基,再建框架,最后装修。 第1层: 风格定调(Style) - 决定画面的"味道" 就像做菜先定菜系(川菜、粤菜),AI绘图也要先定风格基调。 实战代码: "风格": "高调棚拍, 直接闪光灯美学, 东亚社交媒体风格 (如: Ulzzang, 抖音), 风格化美颜修图" 这句话翻译成人话就是:“给我来个小红书那种精修感的照片,要有棚拍的专业感,加点韩式Ulzzang的味道,记得开美颜滤镜。” 这些关键词就像导航的定位点,AI会在它的数据库里搜索匹配这些特征的图片风格,然后融合起来。 第2层: 主体塑造(Subject) - 画面的"主角" 这是整个提示词的核心,也是最吃细节的地方。 想象你在跟警察描述一个人的长相,你会怎么说? 含糊版: “一个年轻女孩” 精准版: “东亚面孔,20岁左右,苗条身材,长发扎丸子头,穿白色吊带和灰色卫衣” AI跟警察一样,细节越多,越能还原你想要的效果。 我们的模板把"主体"拆成了三个子模块: 身体部分: "姿态": "在沙发上放松, 随意坐姿", "姿势": "坐姿, 双腿交叠并收拢于身前", "手势": "右手抬起, 手指微曲, 用指关节轻托下巴和脸颊", "头部倾斜角度": 5 看到没?“头部倾斜角度: 5"这种数值化描述,就像给快递小哥发定位,比"头稍微歪一点"精确一万倍。 面部细节: "表情": "俏皮, 迷人", "凝视": "右眼直视镜头", "眼部动作": "左眼眨眼", "肤色": "极白的瓷器肤色 (提亮美学)", "特征": "左眼下方有一颗小泪痣" 这里有个小心机:“左眼眨眼”+“左眼下方有一颗小泪痣"这种细节,是最容易被AI忽略的,但正因为稀有,一旦生成出来就特别有灵气。 ...