你有没有遇到过这种情况:明明脑子里有个超美的画面,输入AI绘图工具后,出来的却是"买家秀vs卖家秀"的灾难现场?
就像你跟理发师说"稍微修一下",结果变成了"从头再来"一样扎心…
问题出在哪?不是AI不行,是你的"提示词"说得太含糊了。
今天我就拆解一个能精准控制AI的JSON提示词模板,让gemini和豆包乖乖听话,生成抖音同款精修人像。
先看效果,有图有真相



这些图片都是用同一个提示词模板生成的。是的,你没看错,就是一个可以复用的"配方"。
为什么你的提示词总是翻车?
想象一下,你去星巴克点咖啡:
小白说法: “给我一杯咖啡”(结果:随缘,可能是美式可能是拿铁) 老司机说法: “大杯燕麦拿铁,半糖,多冰,extra shot”(结果:精准命中)
AI绘图也是一样的道理。区别在于,你有没有掌握这套"专业黑话"。
所谓的"Prompt工程",说白了就是学会用AI听得懂的语言,把你脑子里的画面翻译出来。
6层结构,搭建你的提示词框架
我把提示词想象成搭积木,每一层都有特定的功能。就像盖房子,先打地基,再建框架,最后装修。
第1层: 风格定调(Style) - 决定画面的"味道"
就像做菜先定菜系(川菜、粤菜),AI绘图也要先定风格基调。
实战代码:
"风格": "高调棚拍, 直接闪光灯美学, 东亚社交媒体风格 (如: Ulzzang, 抖音), 风格化美颜修图"
这句话翻译成人话就是:“给我来个小红书那种精修感的照片,要有棚拍的专业感,加点韩式Ulzzang的味道,记得开美颜滤镜。”
这些关键词就像导航的定位点,AI会在它的数据库里搜索匹配这些特征的图片风格,然后融合起来。
第2层: 主体塑造(Subject) - 画面的"主角"
这是整个提示词的核心,也是最吃细节的地方。
想象你在跟警察描述一个人的长相,你会怎么说?
含糊版: “一个年轻女孩” 精准版: “东亚面孔,20岁左右,苗条身材,长发扎丸子头,穿白色吊带和灰色卫衣”
AI跟警察一样,细节越多,越能还原你想要的效果。
我们的模板把"主体"拆成了三个子模块:
身体部分:
"姿态": "在沙发上放松, 随意坐姿",
"姿势": "坐姿, 双腿交叠并收拢于身前",
"手势": "右手抬起, 手指微曲, 用指关节轻托下巴和脸颊",
"头部倾斜角度": 5
看到没?“头部倾斜角度: 5"这种数值化描述,就像给快递小哥发定位,比"头稍微歪一点"精确一万倍。
面部细节:
"表情": "俏皮, 迷人",
"凝视": "右眼直视镜头",
"眼部动作": "左眼眨眼",
"肤色": "极白的瓷器肤色 (提亮美学)",
"特征": "左眼下方有一颗小泪痣"
这里有个小心机:“左眼眨眼”+“左眼下方有一颗小泪痣"这种细节,是最容易被AI忽略的,但正因为稀有,一旦生成出来就特别有灵气。
妆容拆解:
"妆容": "风格化的韩式/抖音妆: 无瑕哑光底妆, 脸颊上部涂有浓郁的粉色腮红, 粉色渐变唇, 轮廓分明的眉毛, 淡眼线, 强调卧蚕"
注意,我们用分号把底妆、腮红、唇妆、眉毛、眼线、卧蚕逐一列出来,就像化妆师的工序清单,AI会按步骤渲染每一个细节。
第3层: 环境(Environment)与道具(Props) - 烘托氛围的"配角”
环境要纯净,才能突出主体。但完全空白又会显得太假,这时候道具就派上用场了。
"布景": "纯白或浅灰色墙壁前的黑色皮沙发",
"道具": "银色苹果MacBook笔记本电脑, logo可见, 放在主体右侧(画面左侧)的沙发上"
这里有个小技巧:“logo可见"这个细节,既增加了真实感,又暗示了品牌调性(苹果=精致生活)。
另外,“放在主体右侧(画面左侧)的沙发上"这种双重定位,是为了防止AI搞混左右。就像给快递小哥指路:“门口左手边(你面对大门的右手边)"。
第4层: 灯光(Lighting) - 光影是摄影的灵魂
这部分是决定"直闪美学"的关键。
"主光": {
"光源": "闪光灯",
"修饰": "裸灯或直接闪光 (硬光)",
"位置": "靠近相机轴线, 略微偏右并高于视线",
"效果": "在主体背后的墙上投下清晰、深色的阴影; 皮肤和沙发皮革上有强烈的高光"
}
重点在最后一句"效果"描述。我们不只告诉AI用什么灯,还提前剧透了"应该出现清晰阴影"和"应该有强烈高光”。
这就像给AI看"参考答案”,它会反向推导需要多强的光、多硬的质感。
第5层: 相机(Camera) - 模拟摄影师的视角
这部分参数看起来很专业,其实都是在控制"透视"和"景深”。
"焦距_毫米": 50,
"光圈_f": 4.0,
"对焦": { "目标": "靠近的眼睛 (右眼)", "景深": "中等" },
"构图": { "裁切": "从大腿中部到头顶, 头发上方有留白" }
焦距50mm: 最接近人眼视角,画面不变形 光圈f/4.0: 中等景深,主体清晰,背景微虚化 对焦右眼: 人像摄影铁律,眼睛是视觉焦点 裁切留白: 给画面留呼吸空间,不要裁得太满
第6层: 后期处理(Post-processing) - 模拟修图效果
这一层直接决定了"社交媒体感”。
"质感": "皮肤高度平滑, 无毛孔外观 ('瓷娃娃'或'美颜滤镜'效果)",
"锐化": "对眼睛/睫毛进行选择性锐化",
"瑕疵控制": "完全去除所有瑕疵和纹理"
注意"选择性锐化"这个词,意思是只锐化眼睛睫毛,皮肤保持柔和。就像美图秀秀的"磨皮+眼睛增强"功能。
完整模板一键复制
点击展开完整JSON模板(103行)
{
"风格": "高调棚拍, 直接闪光灯美学, 东亚社交媒体风格 (如: Ulzzang, 抖音), 风格化美颜修图",
"输出": {
"色彩空间": "sRGB",
"渲染意图": "照片"
},
"主体": {
"类别": "人类",
"性别表现": "女性",
"族裔": "东亚 (如: 韩国, 中国)",
"年龄段": "青年",
"身体": {
"体型": "苗条",
"比例": "自然人体解剖",
"姿态": "在沙发上放松, 随意坐姿",
"姿势": "坐姿, 双腿交叠并收拢于身前",
"手势": "右手抬起, 手指微曲, 用指关节轻托下巴和脸颊",
"头部倾斜角度": 5
},
"面部": {
"表情": "俏皮, 迷人",
"凝视": "右眼直视镜头",
"眼部动作": "左眼眨眼",
"肤色": "极白的瓷器肤色 (提亮美学)",
"妆容": "风格化的韩式/抖音妆: 无瑕哑光底妆, 脸颊上部涂有浓郁的粉色腮红, 粉色渐变唇, 轮廓分明的眉毛, 淡眼线, 强调卧蚕",
"特征": "左眼下方有一颗小泪痣"
},
"发型": {
"长度": "长发",
"样式": "凌乱的高丸子头, 带有空气刘海和垂下的碎发",
"颜色": "深棕色"
},
"着装": {
"上衣": "白色修身短款吊带",
"外套": "浅灰色拉链连帽衫, 敞开并从双肩滑落",
"下装": "白色抽绳居家短裤",
"鞋履": "赤脚"
}
},
"环境": {
"地点": "摄影棚或极简室内",
"布景": "纯白或浅灰色墙壁前的黑色皮沙发",
"道具": "银色苹果MacBook笔记本电脑, logo可见, 放在主体右侧(画面左侧)的沙发上"
},
"灯光": {
"主光": {
"光源": "闪光灯",
"修饰": "裸灯或直接闪光 (硬光)",
"位置": "靠近相机轴线, 略微偏右并高于视线",
"效果": "在主体背后的墙上投下清晰、深色的阴影; 皮肤和沙发皮革上有强烈的高光"
},
"补光": "极少或无",
"环境光": "被抑制",
"白平衡_K": 5800
},
"相机": {
"系统": "数码相机",
"传感器": "全画幅等效",
"镜头": {
"类型": "定焦",
"焦距_毫米": 50
},
"曝光": {
"ISO": 100,
"光圈_f": 4.0,
"测光": "明亮曝光, 高调美学"
},
"对焦": {
"目标": "靠近的眼睛 (右眼)",
"景深": "中等"
},
"构图": {
"方向": "竖向",
"裁切": "从大腿中部到头顶, 头发上方有留白",
"角度": "平视",
"布局": "主体居中"
}
},
"调色": {
"观感": "明亮, 干净, 略带冷色调",
"对比度": "高",
"饱和度": "中等, 粉色系被强调"
},
"后期处理": {
"降噪": "高",
"质感": "皮肤高度平滑, 无毛孔外观 ('瓷娃娃'或'美颜滤镜'效果)",
"锐化": "对眼睛/睫毛进行选择性锐化",
"瑕疵控制": "完全去除所有瑕疵和纹理"
}
}
实战技巧: 3个让效果翻倍的小心机
1. 数值化的魔力
不要说"头稍微歪一点",要说"头部倾斜角度: 5"。
就像导航软件,“前面左转"不如"50米后左转"精确。AI处理数字的能力比处理形容词强得多。
其他可以数值化的地方:
- 年龄段: 不说"年轻”,说"20-25岁"
- 光圈: 不说"背景虚化",说"光圈f/2.8"
- 饱和度: 不说"颜色鲜艳",说"饱和度+20%"
2. 位置描述的相对论
“放在主体右侧(画面左侧)“这种双重定位,避免AI搞混左右。
因为AI理解的"左右"可能是它的视角,也可能是主体的视角,加个括号注释能大幅减少翻车率。
类似的双重定位还有:
- “相机左侧(主体右手边)”
- “前景(靠近镜头处)”
- “背景(墙壁方向)”
3. 效果预告很重要
不只说用什么设备,还要说预期效果。
普通描述: “使用闪光灯” 高级描述: “使用闪光灯,在背景墙上投下清晰、深色的阴影”
这就像提前给AI看"参考答案”,它会反向推导需要的参数。
常见问题避坑指南
Q: 为什么我的图总是不够精致?
A: 记得加上后期处理参数,特别是"美颜滤镜效果"这种社交媒体特色。
很多人只写拍摄参数,忽略了后期处理。但现在的社交媒体照片,80%的质感来自后期。
Q: gemini和豆包哪个效果更好?
A: 各有千秋。
- gemini: 细节更精准,对专业术语理解更好,适合追求摄影感的创作
- 豆包: 美颜效果更自然,对中文语境理解更好,生成速度更快
建议都试试,看哪个更符合你的需求。
Q: JSON格式太复杂,能简化吗?
A: 可以,但效果会打折扣。
如果你只是想快速出图,可以只保留"风格”+“主体基础信息”+“灯光效果"这三个核心模块。
但如果你想要精确控制每一个细节,完整的JSON结构是必须的。
Q: 为什么同样的提示词,每次生成的图都不一样?
A: 这是AI的随机性,也是它的魅力所在。
如果你想要更稳定的结果,可以:
- 增加细节描述,缩小AI的发挥空间
- 使用固定的随机种子(部分工具支持)
- 多生成几张,挑选最满意的
下一步行动
好了,理论讲完了,该你动手实战了。
立即上手(3分钟出图)
- 复制模板: 点击上面折叠框,复制完整JSON
- 改几个参数: 比如把"丸子头"改成"双马尾”,把"吊带"改成"T恤"
- 丢进AI工具: gemini或豆包都行,生成你的第一张作品
- 调整优化: 对比效果,微调参数,直到满意为止
值得分享吗?
如果这篇文章帮你解决了AI绘图翻车的问题,请:
- 点赞收藏: 方便下次查阅模板
- 转发给朋友: 让更多人掌握控图技巧
- 评论区晒图: 分享你的生成效果,我会精选优秀作品
- 提出问题: 遇到的坑,我来帮你解决
你的转发和互动,是我持续创作的动力!
加入梦兽编程社区
关注"梦兽编程",获取更多AI编程和创作教程:
- AI绘图进阶系列(不同风格模板拆解)
- Prompt工程实战案例
- AI辅助编程技巧
- 前端技术深度解析
评论区见: 晒出你的第一张AI作品,说说你的控图心得,咱们一起交流。
关注我: 后续会出更多实战教程,从"风景"到"动漫",从"写实"到"插画",手把手教你控图。
记住: AI绘图不是魔法,是可以学习的技能。
掌握了这套方法论,你就能像调酒师调制鸡尾酒一样,精确控制每一个细节。从此告别"随缘出图",进入"精准控图"的新时代。
现在,轮到你了。去创造点什么吧,然后回来评论区告诉我!