AI 视频生成模型
提示词官方指南
Seedance 2.0 系列模型原生支持音频与视频联合生成,拥有卓越的语义理解与多模态交互能力。本指南将帮助您快速掌握核心提示词技巧,生成更稳定、更准确的高质量视频。
素材声明
01 30秒快速开始
核心逻辑:就像给导演写剧本
告诉模型 谁 在 什么环境 做 什么动作,并提供 参考图/视频 作为视觉锚点。
3 个万能起手模板
文生视频
纯文字描述,适合天马行空的创意。
图生视频
提供图片,锁定主体特征或画面构图。
视频编辑
提供原视频,进行局部修改或延长。
02 核心公式与基础规则
多模态参考的指代控制
除了文字描述,您还可以通过“投喂素材”来锁定画面的理想标准态。Seedance 2.0 支持图像、音频和视频的深度参考。
核心技巧:明确指代
图片1 的构图”或“动作参考 视频2”。模型将自动提取参考对象中的核心特征,并结合您的文本描述进行创作,确保生成结果在保持创意的同时,具备极高的确定性与还原度。素材使用原则:
- •何时只写文字: 当您需要模型自由发挥,或者描述的是常见事物(如“一只奔跑的马”)时。
- •何时必须传图: 当您需要保持特定的角色长相、特定的商品外观、或特定的 Logo 时。
- •何时建议传视频: 当您需要复刻复杂的动作(如武术连招)、特定的运镜(如第一人称穿梭)或炫酷特效时。
- •上传顺序至关重要: 如果上传了多张图片,必须按顺序上传,并在提示词中严格使用
图片1、图片2进行指代。
03 文字生成
Seedance 2.0 支持在各类场景下生成常用文字。模型能根据情境自动匹配合适的风格与颜色,也支持在提示词中指定文字的颜色、风格、出现方式、出现时机、出现位置。
广告语 (Slogan) 生成
适用场景:电商营销、品牌宣传、片尾定版明确了风格(手绘漫画)、主体动作(吃炸鸡)、环境气氛(友好愉悦)、文字出现时机(画面逐渐模糊后)、位置(画面中部)及内容。
通过指定“画面逐渐模糊”作为前置条件,让文字的出现更加自然,避免生硬的叠加。
「文字内容」+「出现时机」+「出现位置」+「出现方式」,「文字特征(颜色、风格)」同步字幕生成
适用场景:剧情短片、访谈记录、旁白解说不仅描述了画面(夜晚到黎明),还详细描述了声音特征(深沉平静男声)和台词内容,最后指令要求字幕同步。
画面底部出现字幕,字幕内容为“……”,字幕需与音频节奏完全同步。气泡台词生成
适用场景:漫画风视频、短剧、Vlog 互动「角色」说:“……”,角色说话时周围出现气泡,气泡里写着台词。04 图片参考
Seedance 2.0 既支持主体多视角参考,也支持场景图、分镜图等多图参考。
主体多视角参考 (3C数码)
适用场景:商品展示、角色一致性保持提供多个视角的图片能显著提升模型对物体 3D 结构的理解,配合“缓慢旋转”运镜,能完美展示商品细节。
提取「图片1、2、3」中的「主体」,生成「画面描述」,保持「主体」特征一致。多图组合与 Logo 植入
适用场景:品牌广告、复杂场景构建分别指代了人物(图片2)和片尾 Logo(图片1),并用时间顺序(先...再...后...)串联了整个视频的叙事逻辑。
参考「图片2」中的「主体」,生成「画面描述」,画面逐渐模糊后出现「图片1」的 Logo。分镜图严格还原
适用场景:动画制作、广告分镜预览明确指出哪张图对应哪个角色,哪张图对应哪个分镜构图,逻辑越清晰,还原度越高。
参考「图片3」的分镜构图,主体形象参考「图片1」...接着切换至「图片4」的构图...05 视频参考
动作与镜头语言参考
适用场景:武打动作、复杂舞蹈、特定运镜复刻参考「视频1」的「动作/运镜」,生成「画面描述」,保持动作细节一致。特效参考
适用场景:影视特效复刻、魔法科幻元素参考「视频1」的「特效描述」,生成「画面描述」,保持特效一致。06 视频编辑
元素替换
适用场景:后期修图、穿帮镜头处理、商品替换将「视频1」中的「被更换元素」,替换为「图片1」中的「新元素」,动作和运镜不变。轨道补齐限制
07 常见错误诊断
我们总结了新手最容易踩坑的几种提示词写法,请对比优化方案进行调整。
错误 1:指代不清与素材滥用
参考这些图片,生成一个女孩在喝咖啡的视频。
参考图片1的女孩长相,参考图片2的咖啡厅环境,生成女孩喝咖啡的视频。
诊断:上传了多张图片但没有说明每张图的用途,模型会随机融合特征导致画面混乱。必须用“图片1”、“图片2”明确指定用途。
错误 2:视频编辑缺少约束
把视频里的香水换掉。
将视频1中的香水替换成图片1中的面霜,动作和运镜不变。
诊断:没有提供替换的目标(换成什么?),也没有约束其他元素(动作和运镜不变),会导致模型自由发挥,破坏原视频结构。
错误 3:运镜要求缺乏主体支撑
镜头快速旋转,拉近,再拉远,非常炫酷。
以图片1中的跑车为主体,镜头围绕跑车快速旋转,随后拉近展示车灯细节,最后拉远展示整个赛道环境。
诊断:脱离了主体和环境的纯运镜指令是无效的,必须告诉模型镜头是围绕“谁”在“哪里”运动。
08 常见问题 (FAQ)
Q: 为什么生成的文字是乱码或不清晰?
A:请尽量使用常用字,避免生僻字和特殊符号。如果对文字表现效果要求极高,建议使用“图片参考”功能,上传带有清晰 Logo 或文字的图片作为参考。
Q: 怎么控制多张参考图片的顺序和对应关系?
A:上传素材时请按顺序上传,并在提示词中明确使用“图片1”、“图片2”等进行指代。例如:“图片1中的女孩穿着图片2中的衣服”。
Q: 视频延长或轨道补齐有时间限制吗?
A:有的。Seedance 2.0 最多支持 3 段视频输入,总合成时长不得超过 15 秒。