Guia de Prompts do Seedance 2.0: Melhores Prompts, Modelos e Dicas para 2026
Domine a criação de prompts no Seedance 2.0 — desde prompts básicos de texto e imagem até first/last frame cinematográfico, referência-para-vídeo e prompts com áudio. Inclui modelos testados, estratégias para cada modo e a fórmula reutilizável de prompts que funciona em todos os modos do Seedance 2.0.
Você envia uma imagem de referência para o Seedance 2.0, escreve um prompt de texto que parece bom, aperta gerar — e o resultado vira uma bagunça. O sujeito se transforma em outra coisa, o movimento fica estranho, ou a câmera faz algo que você nunca pediu.
Essa é a reclamação número um sobre ferramentas de vídeo com IA em 2026, e na grande maioria dos casos é problema de prompt, não de modelo.
O Seedance 2.0 é diferente dos modelos de vídeo que só aceitam texto. Como ele recebe imagens, vídeos, áudio e texto — e gera vídeo a partir de todos esses insumos juntos — o papel do prompt muda completamente. Seu prompt de texto não precisa mais descrever tudo; ele precisa descrever apenas o que os outros inputs não conseguem fornecer. A qualidade do resultado final depende inteiramente de quão bem você entende essa mudança e escreve de acordo.
Criado a partir de testes com centenas de prompts em todos os modos do Seedance 2.0, este guia oferece um sistema para essa comunicação. Você vai encontrar modelos de prompt testados, estratégias específicas para cada modo e uma fórmula reutilizável que funciona independentemente do tipo de vídeo que você está fazendo. Ao final, você saberá exatamente o que escrever — e o que deixar de fora — para obter resultados consistentes e de alta qualidade no Seedance 2.0.
Por que o Prompt é Tão Importante em 2026
Os modelos de vídeo com IA atingiram um novo patamar de qualidade este ano. O Seedance 2.0 consegue gerar clipes de 10 segundos com movimento coerente, personagens consistentes e iluminação cinematográfica — mas só se o seu prompt disser exatamente o que fazer. Em 2026, a diferença entre um prompt bom e um prompt ruim é a diferença entre um clipe utilizável e um crédito de geração desperdiçado.
As técnicas deste guia funcionam porque se alinham com a forma como o Seedance 2.0 realmente processa prompts, não como os modelos antigos faziam. Entender essa diferença é o primeiro passo para resultados consistentes.
Como o Seedance 2.0 Lê Prompts de Forma Diferente
O Seedance 2.0 processa prompts de maneira diferente dos modelos de vídeo baseados apenas em texto. Como ele aceita múltiplos tipos de entrada, o prompt de texto tem um papel distinto:
| Tipo de Entrada | Função na Geração |
|---|---|
| Prompt de texto | Define movimento, ritmo, câmera e intenção narrativa |
| Imagem de referência | Trava a identidade visual — sujeito, estilo, composição |
| Vídeo de referência | Define estilo de movimento, coreografia, movimentação de câmera |
| Entrada de áudio | Dita ritmo, cadência e alinhamento emocional |
| Direção de estilo | Estética global — cinematográfica, documental, animação |
O insight principal: No Seedance 2.0, seu prompt de texto deve focar no que os outros inputs não conseguem fornecer — movimento, ritmo e fluxo narrativo. Não desperdice palavras do prompt descrevendo o que sua imagem de referência já mostra.
Depois que você entende como o modelo processa diferentes entradas, a próxima pergunta é qual combinação de inputs usar para seu objetivo específico.
Como Escolher o Modo Certo: Um Guia Rápido
Essa é de longe a maior fonte de confusão. Os usuários começam a gerar sem escolher o modo de entrada adequado e depois se perguntam por que o resultado não corresponde ao que esperavam.
| Seu Objetivo | Use Este Modo | Por Quê |
|---|---|---|
| Criar um vídeo a partir de uma ideia escrita | Texto-para-Vídeo | Nenhuma referência necessária; o texto faz todo o trabalho |
| Animar uma imagem específica | Imagem-para-Vídeo | A imagem fornece a base visual; o prompt adiciona movimento |
| Fazer a ponte entre dois quadros-chave | First/Last Frame | O modelo interpola o movimento entre sua imagem inicial e final |
| Manter um personagem ou estilo consistente | Referência-para-Vídeo | Referências fixas garantem identidade entre várias gerações |
| Sincronizar vídeo com música ou voz | Audio-Driven | O áudio dita o ritmo; o prompt define o que aparece |
Se você está começando com apenas uma ideia, comece pelo modo Texto-para-Vídeo. Se tem um personagem ou cena específica para animar, use Imagem-para-Vídeo com uma imagem de referência forte. Começar no modo errado faz com que as primeiras gerações sejam puro teste e tentativa — algo que o modo certo teria evitado.
Depois de escolher seu modo, a fórmula reutilizável abaixo ajuda a estruturar o prompt de texto independentemente de qual modo você está usando.
A Fórmula de Prompt do Seedance 2.0
Esta fórmula funciona em todos os modos. Preencha os campos que se aplicam à sua geração, deixe o resto vazio.
[Contexto do Modo] + [Sujeito + Ação] + [Movimento e Ritmo] + [Direção de Câmera] + [Estilo e Qualidade]
Contexto do Modo (1 frase)
Diga ao modelo que tipo de geração é esta. Isso define as expectativas de como interpretar o resto do prompt.
- "Geração cinematográfica texto-para-vídeo:"
- "Animação imagem-para-vídeo a partir de um retrato:"
- "Transição de primeiro quadro para último quadro:"
- "Vídeo de personagem com referência fixa:"
Sujeito + Ação
O que está no quadro e o que faz. Mantenha uma única ação clara. Múltiplas ações sequenciais confundem o modelo.
Bom: "Uma bailarina executa um grand jeté em um palco escuro"
Ruim: "Uma bailarina faz aquecimento, depois uma pirueta, depois um grand jeté, depois agradece"
Movimento e Ritmo
Como as coisas se movem e em que velocidade. Esta é a parte mais importante do input textual para o Seedance 2.0.
Vocabulário de movimento que funciona:
- "Movimento lento e deliberado — cada quadro tem peso"
- "Movimento dinâmico e acelerado — cortes rápidos no ritmo"
- "Revelação gradual — o sujeito emerge da sombra ao longo de 3 segundos"
- "Movimento contínuo e fluido — sem pausas, sem travamentos"
Direção de Câmera
Onde a câmera está e como se move. O Seedance 2.0 responde bem à linguagem cinematográfica de câmera.
Exemplos:
- "Plano aberto estático, profundidade de campo rasa"
- "Aproximação lenta de plano médio para close-up ao longo de 5 segundos"
- "Câmera aérea overhead, descendo até o nível dos olhos"
- "Estilo câmera na mão, tremor orgânico sutil"
Estilo e Qualidade
A estética visual e a qualidade técnica. Referencie um estilo cinematográfico, tipo de filme ou formato.
- "Look de filme 35mm, granulação natural, correção de cor quente"
- "Digital limpo, nítido, iluminação comercial de produto"
- "Estilo documental, luz disponível, cores realistas"
Modelos de Prompt Específicos por Modo
A fórmula acima se adapta a cada modo de geração. Veja como aplicá-la:
Modelo para Texto-para-Vídeo
[Contexto do Modo] [Sujeito] [realiza ação] em [ambiente]. [Descrição do movimento — velocidade, qualidade, direção]. [Direção de câmera — tipo de plano, movimento]. [Iluminação]. [Duração — 5 ou 10 segundos]. [Estilo + qualidade].Exemplo Testado: "Geração cinematográfica texto-para-vídeo: Um astrônomo solitário observa por um telescópio massivo em um observatório na montanha. Movimento lento e contemplativo — o telescópio acompanha o céu, a luz das estrelas muda através da abertura da cúpula. Plano aberto estático dentro do observatório, luzes âmbar quentes dos instrumentos contrastando com o azul profundo da noite. 10 segundos. Look de filme, sombras ricas, 24fps."
Modelo para Imagem-para-Vídeo
A partir da imagem fornecida: [descreva o movimento não visível na imagem]. [Comportamento da câmera]. [O que fica parado vs o que se move]. [Duração + qualidade].Exemplo Testado: "A partir do retrato fornecido: Uma mudança sutil na expressão — os olhos apertam levemente, um esboço de sorriso se forma. A câmera mantém-se estática, profundidade de campo rasa mantém o rosto nítido enquanto o fundo desfoca suavemente. Rosto e cabelo permanecem naturais — sem deformações, sem distorções. 5 segundos. Qualidade de retrato cinematográfico."
Modelo para First/Last Frame
Transição de [descrição do quadro inicial] para [descrição do quadro final]. A câmera [descreve o trajeto da câmera entre os quadros]. O movimento é [velocidade + qualidade]. [O que deve permanecer consistente]. [Duração + qualidade].Exemplo Testado: "Transição do sujeito parado na borda de um penhasco ao nascer do sol para o sujeito se afastando da câmera ao longo do caminho do penhasco. A câmera mantém a posição durante a transição — sem pan, sem zoom. O movimento é lento e deliberado — 5 segundos para ir do quadro inicial ao final. A identidade do sujeito e as roupas permanece perfeitamente consistente. 10 segundos. Cinematográfico, luz de hora dourada durante toda a cena."
Modelo para Referência-para-Vídeo
Usando as referências fixas: [Referência do sujeito] realiza [ação] em [referência de ambiente], estilizado como [referência de estilo]. [Padrão de movimento]. [Câmera]. [Qualidade].Exemplo Testado: "Usando as referências fixas: O personagem caminha por um beco encharcado de chuva em Tóquio à noite, estilizado como cinema neo-noir. Passos firmes e constantes — a câmera acompanha lateralmente na mesma velocidade, profundidade de campo rasa mantém o personagem nítido contra um bokeh neon suave ao fundo. 10 segundos. Look de lente anamórfica, contraste profundo, granulação de filme."
Modelo para Audio-Driven
Vídeo sincronizado com o áudio fornecido: [descreva o conteúdo visual]. O movimento segue [característica do áudio — batida, ritmo, clima, crescendo]. [Comportamento da câmera acompanhando a energia do áudio]. [Estilo].Exemplo Testado: "Vídeo sincronizado com a faixa de áudio fornecida: Visualizações abstratas do som — partículas de luz pulsam e fluem em resposta à batida. A intensidade do movimento segue a dinâmica do áudio — calma durante os versos, explosiva durante o drop. A câmera flutua pelo campo de partículas, acelerando com o tempo. 10 segundos. Paleta de cores neon, brilho cinematográfico."
O Framework de Teste de Prompts
Depois de escrever seu modelo, teste os prompts de forma sistemática antes de renderizar na qualidade máxima. Este ciclo de baixo custo é sua ferramenta mais importante para desenvolver habilidade com o Seedance 2.0:
- Escreva um prompt base usando a fórmula ou os modelos acima
- Gere em 5s 720p — o mais barato e rápido
- Avalie três dimensões: Qualidade do movimento (1–5), Precisão do sujeito (1–5), Execução da câmera (1–5)
- Ajuste apenas a dimensão mais fraca — mude uma coisa por iteração
- Regere e reavalie — confirme que o ajuste melhorou a pontuação
- Repita até que todas as três dimensões atinjam 4+
- Renderize o final na resolução e duração desejadas
Este framework transforma a engenharia de prompt de um chute em um processo mensurável. O caminho mais rápido para melhorar seus resultados é identificar sua dimensão mais fraca e corrigir apenas ela na sua próxima geração. Mudar várias coisas ao mesmo tempo torna impossível saber o que funcionou.
Depois de dominar a fórmula e o ciclo de teste, aqui estão prompts prontos para cenários comuns.
Melhores Prompts por Caso de Uso
Vitrine de Produto
"Vídeo cinematográfico de produto: Um relógio de luxo flutuando na escuridão. Rotação lenta de 360° revela cada detalhe — a pulseira de metal capta a luz de contorno, o mostrador de cristal reflete uma luz suave principal. Lente macro, close-up extremo, nada no quadro além do relógio. 5 segundos. Qualidade de fotografia comercial de produto, foco nítido durante todo o clipe."
Apresentação de Personagem
"Apresentação cinematográfica de personagem: Uma figura misteriosa em um casaco comprido está sob um poste de luz na chuva. A figura lentamente levanta o olhar em direção à luz — a câmera faz um push-in de plano aberto para close-up médio ao longo de 5 segundos, revelando detalhes faciais gradualmente. A chuva cai em câmera lenta, cada gota capturando a luz âmbar. 10 segundos. Estética film noir."
Paisagem/Viagem
"Plano de estabelecimento aéreo: Uma vila costeira acorda ao amanhecer. A câmera voa lentamente sobre telhados de terracota em direção ao porto — barcos de pesca balançam suavemente, a névoa da manhã se agarra às colinas, a luz dourada quente se espalha pela cena. Movimento de drone contínuo e fluido. 10 segundos. Qualidade de documentário da natureza, cores vibrantes mas naturais."
Sequência de Ação
"Ação dinâmica: Um atleta de parkour corre sobre telhados ao pôr do sol. Movimento rápido e atlético — a câmera acompanha por trás, depois gira para um perfil lateral enquanto o atleta salta um vão entre edifícios. Cortes rápidos e rampas de velocidade acompanham o ritmo do movimento. 5 segundos. Cinematografia esportiva de alta energia."
Armadilhas de Prompt para Especialistas (e Como Resolvê-las)
Mesmo com bons modelos, certos padrões produzem falhas consistentemente. Estes não são erros de iniciante — são armadilhas em que usuários experientes caem, e elas silenciosamente arruínam gerações. Cada armadilha abaixo segue a mesma estrutura: o cenário, a causa raiz e a solução.
Armadilha 1: Descrever a Imagem em Vez do Movimento
Cenário: Você envia uma imagem de referência e depois escreve um prompt de texto descrevendo o que já está visível na imagem — a aparência do sujeito, o fundo, a iluminação.
Causa Raiz: Você está tratando o prompt de texto como a descrição completa do vídeo, quando a imagem já fornece a maior parte da informação visual. O prompt de texto deve descrever o que a imagem não contém.
Solução: Antes de escrever, pergunte-se: "O que meu material de referência já não mostra?" Escreva apenas isso.
Armadilha 2: Sobrecarregar o Contexto do Modo
Cenário: Seu contexto de modo tem três ou quatro frases, descrevendo passo a passo o que você quer que o modelo faça.
Causa Raiz: Você assume que o contexto do modo precisa explicar o processo de geração para o modelo. Na realidade, o contexto do modo é uma bandeira que diz ao modelo como interpretar seu prompt — mantê-lo em uma frase preserva sua força de sinal. Várias frases diluem a instrução em conteúdo comum.
Solução: "Geração cinematográfica texto-para-vídeo:" é suficiente. Você não precisa explicar o que texto-para-vídeo significa.
Armadilha 3: Descrições Abstratas de Movimento
Cenário: Você usa frases como "movimento dinâmico", "trabalho de câmera interessante" ou "bom ritmo" nos seus prompts e obtém resultados genéricos e sem inspiração.
Causa Raiz: Palavras abstratas não se traduzem em instruções de movimento específicas. O modelo interpreta adjetivos genéricos de forma diferente a cada vez, produzindo resultados inconsistentes.
Solução: Substitua toda palavra abstrata de movimento por uma descrição concreta. "Dinâmico" → "Push-in rápido enquanto o sujeito se vira." "Interessante" → "Câmera aérea overhead descendo ao nível dos olhos."
Armadilha 4: Ignorar a Duração no Prompt
Cenário: Você escreve uma sequência de movimento detalhada mas deixa a duração no padrão, ou muda a configuração de duração sem ajustar a descrição do movimento.
Causa Raiz: A duração controla como o modelo distribui o movimento no tempo. Um prompt descrevendo uma revelação lenta de 10 segundos parecerá apressado em 5 segundos, e um corte rápido de 5 segundos se arrastará em 10 segundos. O modelo ajusta o ritmo do movimento para preencher a duração que você definiu.
Solução: Sempre inclua uma indicação de duração no prompt que corresponda à sua configuração de duração. "Ao longo de 5 segundos" suporta um push-in rápido da câmera. Ou "uma revelação lenta de 10 segundos pela cena."
Armadilha 5: Áudio Sem Direção Visual
Cenário: Você envia áudio para o modo audio-driven mas não descreve o que deve aparecer na tela.
Causa Raiz: O modo audio-driven usa o áudio enviado para ritmo e clima, mas ainda precisa de uma direção visual. Sem ela, o modelo produz resultados abstratos, geralmente inutilizáveis.
Solução: Sempre acompanhe o áudio com uma descrição visual clara. O áudio influencia o ritmo; o prompt define o que o espectador realmente vê.
Uso Responsável de Prompts: Custos, Créditos e Testes Eficientes
Além da qualidade do prompt, gerenciar o custo de geração e os créditos é parte essencial do trabalho profissional com o Seedance 2.0. Gerar vídeo com IA não é gratuito — cada geração consome tempo de computação e créditos, e os custos variam significativamente conforme resolução e duração.
A consciência de custo importa antes de começar. Uma única geração de 10 segundos em 1080p pode custar de 5 a 10 vezes mais que um teste em 5s 720p. Testar em baixa resolução primeiro não é apenas mais rápido — é substancialmente mais barato.
Como testar sem desperdiçar créditos
- Sempre comece em 5 segundos, 720p. Esta é sua resolução de exploração. Reserve resoluções mais altas apenas para a renderização final.
- Mude uma variável por geração. Mudar modo, sujeito, câmera e duração de uma vez produz resultados dos quais você não consegue aprender.
- Mantenha um registro de avaliações. Para cada geração de teste, anote o prompt, as três pontuações (movimento, precisão, câmera) e o que você mudou. Após 10–15 testes registrados, os padrões ficam visíveis.
Quando renderizar na qualidade máxima
Renderize em 1080p apenas depois que seu ciclo de teste confirmar que todas as três dimensões pontuam 4+ em 720p. Um prompt ruim em 720p continuará sendo um prompt ruim em 1080p — resolução não conserta uma descrição de movimento fraca ou uma direção de câmera vaga.
Regra Geral
Para cada 1 minuto de vídeo final, reserve de 15 a 20 minutos de teste em 720p. Essa proporção se mantém na maioria dos casos de uso. Se você está gastando significativamente menos tempo testando, está gerando no escuro. Se está gastando significativamente mais, revise se você está mudando muitas variáveis por iteração de teste.
Biblioteca de Prompts: Referência Rápida
Salve e adapte estes pontos de partida para sua próxima geração:
Cinematográfico: "Plano cinematográfico: [sujeito] em [ambiente]. [Movimento de câmera]. [Descrição da iluminação]. [Duração]. 24fps, granulação de filme, contraste rico."
Comercial: "Vídeo comercial de produto: [produto] em [fundo]. [Movimento de câmera] lento. Iluminação de estúdio, foco nítido. [Duração]. Acabamento limpo e polido."
Documental: "Estilo documental: [sujeito] [ação] em [ambiente real]. Câmera na mão, luz disponível, cores naturais. [Duração]. Sensação de verité."
Redes Sociais: "Vídeo vertical para redes sociais: [sujeito] [ação]. Movimento rápido e dinâmico. Cores vibrantes, alta energia. Proporção 9:16. [Duração]."
Conclusão
O Seedance 2.0 recompensa prompts bem estruturados — mas estrutura sozinha não garante qualidade. Os ganhos reais vêm de combinar a estrutura certa com um hábito sistemático de teste.
O fluxo de trabalho completo é este: escolha o modo certo usando o guia de decisão, escreva seu prompt usando a fórmula de cinco elementos, adapte-o com o modelo específico do modo, teste a baixo custo mudando uma dimensão por iteração, e renderize o final apenas quando suas três pontuações confirmarem que o prompt funciona.
A mudança mais impactante que você pode fazer agora: na próxima vez que uma geração do Seedance 2.0 falhar, não reescreva o prompt inteiro. Identifique qual dos cinco elementos da fórmula estava mais fraco, corrija apenas aquele, e regere. Você verá a diferença em um ciclo de teste.
Experimente sua primeira geração de teste em seedance2pro.io. Comece com uma renderização 5s 720p usando a fórmula acima — veja o que um prompt estruturado produz antes de partir para a qualidade máxima. Para a referência completa de funcionalidades do Seedance 2.0, veja o Guia Completo do Seedance 2.0.
FAQ
Qual deve ser o tamanho de um prompt no Seedance 2.0?
Entre 50 e 120 palavras é o ponto ideal para a maioria dos modos. Com menos de 30 palavras, o modelo fica sem informações suficientes sobre movimento e câmera. Com mais de 150 palavras, você ultrapassa a capacidade de atenção efetiva do modelo para detalhes do prompt.
Preciso descrever minha imagem de referência no prompt de texto?
Não. O Seedance 2.0 analisa as imagens de referência diretamente. Seu prompt de texto deve descrever movimento, câmera e ritmo — coisas que a imagem não contém. Redescrever a imagem desperdiça espaço do prompt.
Posso usar o mesmo prompt para modos diferentes?
Parcialmente. Os elementos de sujeito e estilo podem ser transferidos, mas as direções de movimento e câmera geralmente precisam de ajustes específicos para cada modo. Um prompt de texto-para-vídeo terá desempenho inferior no modo imagem-para-vídeo sem adaptação.
Quais são os melhores prompts para qualidade cinematográfica?
Prompts que incluem linguagem de câmera específica (tipo de plano, lente, movimento), descrição de iluminação e uma referência de estilo (tipo de filme, correção de cor) produzem resultados consistentemente mais cinematográficos. A palavra "cinematográfico" sozinha não resolve.
Como fazer prompts para personagens consistentes em vários vídeos?
Use o modo referência-para-vídeo com uma imagem de referência do sujeito fixada. Mantenha a descrição do personagem consistente entre os prompts, mas varie a ação, o ambiente e a câmera para criar diferentes planos do mesmo personagem.
Quantas gerações de teste devo esperar antes de obter um resultado utilizável?
De 3 a 5 iterações por cena é o normal quando se parte de um prompt base. Cenas mais complexas com requisitos específicos de movimento ou câmera podem precisar de 8 a 12 iterações antes que todas as três dimensões de qualidade atinjam 4+.
Autor
Boletim
Junte-se à comunidade
Inscreva-se em nossa newsletter para receber as últimas notícias e atualizações