抖音vlog号脚本提示词模板
2026-06-12
2026-06-16 0
扣子(Coze)与Stable Diffusion结合可实现服装设计“一句话指令→结构化提示→批量出图→反馈修正”闭环:通过知识库导入词典、配置SD插件与参数、工作流自动解析/生成/修正提示词,并支持通配符灵感激发。

你需要让AI服装设计助理自动理解需求、生成款式图、支持多角度展示并快速迭代修改,而不是手动拼凑提示词反复试错。扣子(Coze)作为智能体编排平台,能接管用户对话逻辑与工作流调度,Stable Diffusion则负责图像生成,二者结合可实现“一句话指令→结构化提示→批量出图→反馈修正”的闭环。
第一步:新建Bot,选择「空白模板」,关闭「默认回复」开关,避免干扰专业流程。
第二步:进入「知识库」→「上传文件」,将你整理好的《服装风格词典.xlsx》《材质关键词表.txt》《版式术语对照表》三份文档全部导入——这些是后续自动补全提示词的底层依据,【缺少任一文件,智能体将无法识别“垂坠感西装外套”或“解构主义衬衫”这类复合描述】。
第三步:在「技能」→「插件」中启用「Stable Diffusion WebUI API」插件,填写你的SD本地服务地址(如http://127.0.0.1:7860),测试连接成功后勾选「启用」。
方法一:使用「工作流」节点链式处理
添加「文本提取」节点,从用户输入中识别服装类型(如“连衣裙”“工装裤”)、风格关键词(如“Y2K”“新中式”)、约束条件(如“不要露肩”“需三视图”);
接「条件判断」节点,若检测到“三视图”“版式图”“设计稿”等词,则自动拼接固定前缀:(fashion costume design sheet, three views, multi-angle display, clothing design, blueprint);
再经「知识库检索」节点,根据识别出的风格匹配《服装风格词典》中的权威描述,例如用户说“赛博朋克”,就替换为“neon-accented asymmetrical jacket, reflective PVC material, cyberpunk streetwear, dystopian urban background”;
最后输出完整正向提示词至SD插件节点。
方法二:用「代码」节点硬编码映射(适合高频固定需求)
直接写Python脚本:当用户输入含“高定礼服”时,强制注入haute couture, hand-embroidered tulle, structured silhouette, atelier lighting, Vogue editorial style,并剔除所有低质量相关词;
这一步必须关闭SD默认反向提示词,否则人工注入的高质量修饰词会被模型自动过滤掉。
打开WebUI的Settings →「Stable Diffusion checkpoint」选择AWPainting模型(专为服装纹理优化);
在Sampling中设置采样器为DPM++ 2M Karras,Steps设为30,CFG Scale调至7——过高会过度拟合提示词导致形变,过低则细节丢失;
Resolution固定为512×768,这是服装版式图的最佳长宽比,能同时容纳全身轮廓与局部细节;
启用Hires.fix:放大算法选R-ESRGAN 4X+,重绘幅度设为0.3,【超过0.4会导致接缝处纹理断裂,尤其影响袖口/领口等关键部位】。
第一步:在扣子Bot的「对话流」中添加「图片解析」节点,接入CLIP Interrogator插件,自动读取SD生成图的视觉特征;
第二步:当用户说“领子太小”“裙摆不够蓬”时,触发「语义对比」模块——将原始提示词与图片解析结果做差分,定位缺失项(如解析出“collar: small round neckline”,而原提示词无领型描述);
第三步:自动生成修正指令:“add oversized Peter Pan collar with lace trim, increase skirt volume by 40%”并重新提交SD;
整个过程无需用户手动改写提示词,修正响应时间控制在12秒内。
将Clothes wildcards通配符解压后放入sd-webui-akiextensionssd-dynamic-promptswildcards目录;
在扣子工作流的提示词生成环节,对用户模糊需求(如“给我点灵感”)自动插入{clothes_style} {fabric_texture} {color_palette}占位符;
SD运行时动态抽取组合,一次生成9宫格差异款,覆盖“波西米亚亚麻长裙+陶土色系”到“未来主义金属风夹克+霓虹渐变”全光谱;
这步操作必须确保Wildcards Manager插件已启用且完成Collection actions刷新,否则占位符会被当作普通文本忽略。