抖音vlog号脚本提示词模板
2026-06-12
2026-06-14 0
用可灵AI生成高质量视频需严格遵循五要素提示词结构:主体、动作、镜头、风格、画质与运动要求;漏掉镜头或运动要求易致卡顿,缺风格则失去设计意图;人物描述须具体到穿着、姿态、微表情与环境光,动态需量化时间与物理逻辑,物体场景要明确材质、空间锚点与镜头路径。

用可灵AI生成高质量视频时,提示词写得不准会导致画面模糊、动作僵硬或主体漂移。你需要明确描述镜头语言、主体特征、运动逻辑和画质参数,而不是堆砌形容词。
第一步:写清主体(谁/什么)→ 第二步:说明动作或状态(正在做什么/静止在什么情境中)→ 第三步:定义镜头(近景/俯拍/推镜等)→ 第四步:指定风格(胶片感/赛博朋克/水墨风)→ 第五步:补充画质与运动要求(4K、慢动作、平滑运镜)。
漏掉第三步“镜头”或第五步“运动要求”,视频大概率会卡在默认广角静帧;漏掉第四步“风格”,AI会按通用高清摄影逻辑渲染,失去设计意图。
方法一:用“穿着+姿态+微表情+环境光”替代“漂亮女孩”
错误示范:“一个漂亮的中国女孩在咖啡馆”——AI无法识别“漂亮”的视觉落点,会随机分配五官比例和光影方向。
正确写法:“穿米白色高领毛衣的25岁亚裔女性,左手托腮望向窗外,睫毛在午后斜射光下投出细影,背景虚化咖啡馆木桌与拿铁杯”。
方法二:给动态加物理约束
写“她转身微笑”不如写“她以左脚为轴心顺时针旋转90度,发梢自然扬起,嘴角从放松到上扬耗时1.2秒”——【可灵对时间量化的响应远高于对情绪词汇的响应】。
① 先锁定核心物体材质与反光特性:比如“氧化铜色复古电话亭”比“老式电话亭”更能触发准确纹理。
② 用空间锚点替代模糊方位词:“电话亭左侧30cm处积水倒映霓虹灯牌”比“电话亭旁边有水洼”更易生成稳定构图。
③ 加入镜头运动路径:“无人机从电话亭顶部垂直下降至齐胸高度,保持机身水平,水面倒影始终居中”——这一步能直接规避AI常见的画面抖动与中心偏移。