精准控图!一个JSON模板让AI绘图100%听你的话

你有没有遇到过这种情况:明明脑子里有个超美的画面,输入AI绘图工具后,出来的却是"买家秀vs卖家秀"的灾难现场?

就像你跟理发师说"稍微修一下",结果变成了"从头再来"一样扎心…

问题出在哪?不是AI不行,是你的"提示词"说得太含糊了。

今天我就拆解一个能精准控制AI的JSON提示词模板,让gemini和豆包乖乖听话,生成抖音同款精修人像。

先看效果,有图有真相

gemini生成的抖音风格人像效果图 - 直闪美学展示

豆包AI生成的韩式妆容人像 - 美颜滤镜效果

豆包生成的社交媒体风格人像 - 高调棚拍示例

这些图片都是用同一个提示词模板生成的。是的,你没看错,就是一个可以复用的"配方"。

为什么你的提示词总是翻车?

想象一下,你去星巴克点咖啡:

小白说法: “给我一杯咖啡”(结果:随缘,可能是美式可能是拿铁) 老司机说法: “大杯燕麦拿铁,半糖,多冰,extra shot”(结果:精准命中)

AI绘图也是一样的道理。区别在于,你有没有掌握这套"专业黑话"。

所谓的"Prompt工程",说白了就是学会用AI听得懂的语言,把你脑子里的画面翻译出来。

6层结构,搭建你的提示词框架

我把提示词想象成搭积木,每一层都有特定的功能。就像盖房子,先打地基,再建框架,最后装修。

第1层: 风格定调(Style) - 决定画面的"味道"

就像做菜先定菜系(川菜、粤菜),AI绘图也要先定风格基调。

实战代码:

"风格": "高调棚拍, 直接闪光灯美学, 东亚社交媒体风格 (如: Ulzzang, 抖音), 风格化美颜修图"

这句话翻译成人话就是:“给我来个小红书那种精修感的照片,要有棚拍的专业感,加点韩式Ulzzang的味道,记得开美颜滤镜。”

这些关键词就像导航的定位点,AI会在它的数据库里搜索匹配这些特征的图片风格,然后融合起来。

第2层: 主体塑造(Subject) - 画面的"主角"

这是整个提示词的核心,也是最吃细节的地方。

想象你在跟警察描述一个人的长相,你会怎么说?

含糊版: “一个年轻女孩” 精准版: “东亚面孔,20岁左右,苗条身材,长发扎丸子头,穿白色吊带和灰色卫衣”

AI跟警察一样,细节越多,越能还原你想要的效果。

我们的模板把"主体"拆成了三个子模块:

身体部分:

"姿态": "在沙发上放松, 随意坐姿",
"姿势": "坐姿, 双腿交叠并收拢于身前",
"手势": "右手抬起, 手指微曲, 用指关节轻托下巴和脸颊",
"头部倾斜角度": 5

看到没?“头部倾斜角度: 5"这种数值化描述,就像给快递小哥发定位,比"头稍微歪一点"精确一万倍。

面部细节:

"表情": "俏皮, 迷人",
"凝视": "右眼直视镜头",
"眼部动作": "左眼眨眼",
"肤色": "极白的瓷器肤色 (提亮美学)",
"特征": "左眼下方有一颗小泪痣"

这里有个小心机:“左眼眨眼”+“左眼下方有一颗小泪痣"这种细节,是最容易被AI忽略的,但正因为稀有,一旦生成出来就特别有灵气。

妆容拆解:

"妆容": "风格化的韩式/抖音妆: 无瑕哑光底妆, 脸颊上部涂有浓郁的粉色腮红, 粉色渐变唇, 轮廓分明的眉毛, 淡眼线, 强调卧蚕"

注意,我们用分号把底妆、腮红、唇妆、眉毛、眼线、卧蚕逐一列出来,就像化妆师的工序清单,AI会按步骤渲染每一个细节。

第3层: 环境(Environment)与道具(Props) - 烘托氛围的"配角”

环境要纯净,才能突出主体。但完全空白又会显得太假,这时候道具就派上用场了。

"布景": "纯白或浅灰色墙壁前的黑色皮沙发",
"道具": "银色苹果MacBook笔记本电脑, logo可见, 放在主体右侧(画面左侧)的沙发上"

这里有个小技巧:“logo可见"这个细节,既增加了真实感,又暗示了品牌调性(苹果=精致生活)。

另外,“放在主体右侧(画面左侧)的沙发上"这种双重定位,是为了防止AI搞混左右。就像给快递小哥指路:“门口左手边(你面对大门的右手边)"。

第4层: 灯光(Lighting) - 光影是摄影的灵魂

这部分是决定"直闪美学"的关键。

"主光": {
  "光源": "闪光灯",
  "修饰": "裸灯或直接闪光 (硬光)",
  "位置": "靠近相机轴线, 略微偏右并高于视线",
  "效果": "在主体背后的墙上投下清晰、深色的阴影; 皮肤和沙发皮革上有强烈的高光"
}

重点在最后一句"效果"描述。我们不只告诉AI用什么灯,还提前剧透了"应该出现清晰阴影"和"应该有强烈高光”。

这就像给AI看"参考答案”,它会反向推导需要多强的光、多硬的质感。

第5层: 相机(Camera) - 模拟摄影师的视角

这部分参数看起来很专业,其实都是在控制"透视"和"景深”。

"焦距_毫米": 50,
"光圈_f": 4.0,
"对焦": { "目标": "靠近的眼睛 (右眼)", "景深": "中等" },
"构图": { "裁切": "从大腿中部到头顶, 头发上方有留白" }

焦距50mm: 最接近人眼视角,画面不变形 光圈f/4.0: 中等景深,主体清晰,背景微虚化 对焦右眼: 人像摄影铁律,眼睛是视觉焦点 裁切留白: 给画面留呼吸空间,不要裁得太满

第6层: 后期处理(Post-processing) - 模拟修图效果

这一层直接决定了"社交媒体感”。

"质感": "皮肤高度平滑, 无毛孔外观 ('瓷娃娃'或'美颜滤镜'效果)",
"锐化": "对眼睛/睫毛进行选择性锐化",
"瑕疵控制": "完全去除所有瑕疵和纹理"

注意"选择性锐化"这个词,意思是只锐化眼睛睫毛,皮肤保持柔和。就像美图秀秀的"磨皮+眼睛增强"功能。

完整模板一键复制

点击展开完整JSON模板(103行)

{
  "风格": "高调棚拍, 直接闪光灯美学, 东亚社交媒体风格 (如: Ulzzang, 抖音), 风格化美颜修图",
  "输出": {
    "色彩空间": "sRGB",
    "渲染意图": "照片"
  },
  "主体": {
    "类别": "人类",
    "性别表现": "女性",
    "族裔": "东亚 (如: 韩国, 中国)",
    "年龄段": "青年",
    "身体": {
      "体型": "苗条",
      "比例": "自然人体解剖",
      "姿态": "在沙发上放松, 随意坐姿",
      "姿势": "坐姿, 双腿交叠并收拢于身前",
      "手势": "右手抬起, 手指微曲, 用指关节轻托下巴和脸颊",
      "头部倾斜角度": 5
    },
    "面部": {
      "表情": "俏皮, 迷人",
      "凝视": "右眼直视镜头",
      "眼部动作": "左眼眨眼",
      "肤色": "极白的瓷器肤色 (提亮美学)",
      "妆容": "风格化的韩式/抖音妆: 无瑕哑光底妆, 脸颊上部涂有浓郁的粉色腮红, 粉色渐变唇, 轮廓分明的眉毛, 淡眼线, 强调卧蚕",
      "特征": "左眼下方有一颗小泪痣"
    },
    "发型": {
      "长度": "长发",
      "样式": "凌乱的高丸子头, 带有空气刘海和垂下的碎发",
      "颜色": "深棕色"
    },
    "着装": {
      "上衣": "白色修身短款吊带",
      "外套": "浅灰色拉链连帽衫, 敞开并从双肩滑落",
      "下装": "白色抽绳居家短裤",
      "鞋履": "赤脚"
    }
  },
  "环境": {
    "地点": "摄影棚或极简室内",
    "布景": "纯白或浅灰色墙壁前的黑色皮沙发",
    "道具": "银色苹果MacBook笔记本电脑, logo可见, 放在主体右侧(画面左侧)的沙发上"
  },
  "灯光": {
    "主光": {
      "光源": "闪光灯",
      "修饰": "裸灯或直接闪光 (硬光)",
      "位置": "靠近相机轴线, 略微偏右并高于视线",
      "效果": "在主体背后的墙上投下清晰、深色的阴影; 皮肤和沙发皮革上有强烈的高光"
    },
    "补光": "极少或无",
    "环境光": "被抑制",
    "白平衡_K": 5800
  },
  "相机": {
    "系统": "数码相机",
    "传感器": "全画幅等效",
    "镜头": {
      "类型": "定焦",
      "焦距_毫米": 50
    },
    "曝光": {
      "ISO": 100,
      "光圈_f": 4.0,
      "测光": "明亮曝光, 高调美学"
    },
    "对焦": {
      "目标": "靠近的眼睛 (右眼)",
      "景深": "中等"
    },
    "构图": {
      "方向": "竖向",
      "裁切": "从大腿中部到头顶, 头发上方有留白",
      "角度": "平视",
      "布局": "主体居中"
    }
  },
  "调色": {
    "观感": "明亮, 干净, 略带冷色调",
    "对比度": "高",
    "饱和度": "中等, 粉色系被强调"
  },
  "后期处理": {
    "降噪": "高",
    "质感": "皮肤高度平滑, 无毛孔外观 ('瓷娃娃'或'美颜滤镜'效果)",
    "锐化": "对眼睛/睫毛进行选择性锐化",
    "瑕疵控制": "完全去除所有瑕疵和纹理"
  }
}

实战技巧: 3个让效果翻倍的小心机

1. 数值化的魔力

不要说"头稍微歪一点",要说"头部倾斜角度: 5"。

就像导航软件,“前面左转"不如"50米后左转"精确。AI处理数字的能力比处理形容词强得多。

其他可以数值化的地方:

年龄段: 不说"年轻”,说"20-25岁"
光圈: 不说"背景虚化",说"光圈f/2.8"
饱和度: 不说"颜色鲜艳",说"饱和度+20%"

2. 位置描述的相对论

“放在主体右侧(画面左侧)“这种双重定位,避免AI搞混左右。

因为AI理解的"左右"可能是它的视角,也可能是主体的视角,加个括号注释能大幅减少翻车率。

类似的双重定位还有:

“相机左侧(主体右手边)”
“前景(靠近镜头处)”
“背景(墙壁方向)”

3. 效果预告很重要

不只说用什么设备,还要说预期效果。

普通描述: “使用闪光灯” 高级描述: “使用闪光灯,在背景墙上投下清晰、深色的阴影”

这就像提前给AI看"参考答案”,它会反向推导需要的参数。

常见问题避坑指南

Q: 为什么我的图总是不够精致?

A: 记得加上后期处理参数,特别是"美颜滤镜效果"这种社交媒体特色。

很多人只写拍摄参数,忽略了后期处理。但现在的社交媒体照片,80%的质感来自后期。

Q: gemini和豆包哪个效果更好?

A: 各有千秋。

gemini: 细节更精准,对专业术语理解更好,适合追求摄影感的创作
豆包: 美颜效果更自然,对中文语境理解更好,生成速度更快

建议都试试,看哪个更符合你的需求。

Q: JSON格式太复杂,能简化吗?

A: 可以,但效果会打折扣。

如果你只是想快速出图,可以只保留"风格”+“主体基础信息”+“灯光效果"这三个核心模块。

但如果你想要精确控制每一个细节,完整的JSON结构是必须的。

Q: 为什么同样的提示词,每次生成的图都不一样?

A: 这是AI的随机性,也是它的魅力所在。

如果你想要更稳定的结果,可以:

增加细节描述,缩小AI的发挥空间
使用固定的随机种子(部分工具支持)
多生成几张,挑选最满意的

下一步行动

好了,理论讲完了,该你动手实战了。

立即上手(3分钟出图)

复制模板: 点击上面折叠框,复制完整JSON
改几个参数: 比如把"丸子头"改成"双马尾”,把"吊带"改成"T恤"
丢进AI工具: gemini或豆包都行,生成你的第一张作品
调整优化: 对比效果,微调参数,直到满意为止

值得分享吗?

如果这篇文章帮你解决了AI绘图翻车的问题,请:

点赞收藏: 方便下次查阅模板
转发给朋友: 让更多人掌握控图技巧
评论区晒图: 分享你的生成效果,我会精选优秀作品
提出问题: 遇到的坑,我来帮你解决

你的转发和互动,是我持续创作的动力!

加入梦兽编程社区

关注"梦兽编程",获取更多AI编程和创作教程:

AI绘图进阶系列(不同风格模板拆解)
Prompt工程实战案例
AI辅助编程技巧
前端技术深度解析

评论区见: 晒出你的第一张AI作品,说说你的控图心得,咱们一起交流。

关注我: 后续会出更多实战教程,从"风景"到"动漫",从"写实"到"插画",手把手教你控图。

记住: AI绘图不是魔法,是可以学习的技能。

掌握了这套方法论,你就能像调酒师调制鸡尾酒一样,精确控制每一个细节。从此告别"随缘出图",进入"精准控图"的新时代。

现在,轮到你了。去创造点什么吧,然后回来评论区告诉我!

先看效果,有图有真相#

为什么你的提示词总是翻车?#

6层结构,搭建你的提示词框架#

第1层: 风格定调(Style) - 决定画面的"味道"#

第2层: 主体塑造(Subject) - 画面的"主角"#

第3层: 环境(Environment)与道具(Props) - 烘托氛围的"配角”#

第4层: 灯光(Lighting) - 光影是摄影的灵魂#

第5层: 相机(Camera) - 模拟摄影师的视角#

第6层: 后期处理(Post-processing) - 模拟修图效果#

完整模板一键复制#

实战技巧: 3个让效果翻倍的小心机#

1. 数值化的魔力#

2. 位置描述的相对论#

3. 效果预告很重要#

常见问题避坑指南#

Q: 为什么我的图总是不够精致?#

Q: gemini和豆包哪个效果更好?#

Q: JSON格式太复杂,能简化吗?#

Q: 为什么同样的提示词,每次生成的图都不一样?#

下一步行动#

立即上手(3分钟出图)#

值得分享吗?#

加入梦兽编程社区#