Tenha Mais Controlo com as Novas Funcionalidades “Pré-visualização de Áudio” e “Pausa”

Jan 11, 2025

Funcionalidades de pré-visualização de áudio e pausa para criação de conteúdos em vídeo

Produzir conteúdos de vídeo de alta qualidade depende muitas vezes dos mais pequenos detalhes — como a pronúncia de uma palavra ou o tempo de uma pausa dramática. Temos o prazer de apresentar duas novas funcionalidades — Pré-visualização de Áudio e Pausa — que lhe oferecem mais precisão e flexibilidade antes de avançar para a geração do vídeo final.

Porquê Pré-visualizar o Áudio?

A Pré-visualização de Áudio é uma verdadeira revolução para quem quer garantir que a narração por conversão de texto em fala (TTS) soa exatamente como pretende antes de gastar créditos na criação do vídeo. Antes, passava diretamente do texto para o vídeo final. Embora este fluxo fosse prático, não permitia grandes ajustes — e se detetasse um erro, já teria gasto créditos. Com a Pré-visualização de Áudio, pode:

  1. Verificar Pronúncia e Tom
    Ouça toda a faixa de áudio gerada a partir do seu texto e confirme se corresponde ao estilo desejado.
  2. Poupar Créditos
    Detetar um erro no áudio antes de renderizar o vídeo evita gastos desnecessários.
  3. Evitar Artefactos de Streaming
    Quando o áudio é gerado em tempo real para sincronizar com o vídeo (um “pipeline de streaming”), algumas vozes de IA podem apresentar pequenas inconsistências de volume no início e no fim. Ao usar primeiro a Pré-visualização de Áudio, pode evitar estes artefactos e obter um resultado final mais polido.

Erros Comuns e Cuidados com o Texto: Embora a tecnologia TTS tenha evoluído bastante, certas complexidades ainda podem causar desafios. Preste especial atenção a:

  • Termos Técnicos ou Especializados: Jargão médico, jurídico ou científico pode exigir ajustes de pontuação ou ortografia.
  • Abreviaturas: Certifique-se de que o TTS as expande ou pronuncia corretamente.
  • Moedas e Números: O narrador pode ler números num formato inesperado ou ignorar símbolos monetários.
  • Pontuação Excessiva: Pontos, vírgulas e dois-pontos influenciam a entoação e o ritmo do TTS.

Se detetar algum problema, basta rever o texto, executar novamente a Pré-visualização de Áudio e confirmar que está perfeito antes de clicar em “Gerar Vídeo Falante”.

Apresentamos a Funcionalidade de Pausa

Por vezes, é importante abrandar para criar impacto dramático, dar ênfase a uma frase ou tratar palavras difíceis com precisão. A nova opção Pausa — acessível através do ícone “⏱ +0,5” — permite inserir uma breve pausa em qualquer parte do seu guião. Se precisar de uma pausa mais longa, basta adicionar vários ícones de pausa no texto. Esta pausa manual pode:

  • Melhorar a Clareza: Divida frases longas para que o ouvinte compreenda claramente cada segmento.
  • Reforçar a Ênfase: Crie antecipação antes de uma afirmação importante ou de uma punchline humorística.
  • Sobrepor as Pausas Padrão do TTS: Se o motor de texto para fala não faz pausa onde pretende — ou adiciona uma pausa indesejada —, adicionar pausas manualmente garante que a narração final flui como idealizou.

Dicas Importantes

A Pré-visualização de Áudio utiliza uma quota baseada em caracteres, que é renovada mensalmente de acordo com o seu plano de subscrição. Como referência, 1 minuto de fala corresponde a cerca de 1.000 caracteres:

  • Pro: 10.000 caracteres (~10 min de áudio)
  • Advanced: 50.000 caracteres (~50 min de áudio)
  • Ultra: 100.000 caracteres (~100 min de áudio)

Dicas para a Funcionalidade de Pausa (Stopwatch):

  • Cada ícone de pausa representa uma pausa de 0,5 segundos, podendo ser usados consecutivamente para criar pausas mais longas, até um máximo de 3 segundos.
  • Lembrete: Evite usar mais de duas pausas consecutivas no mesmo segmento de texto, pois isso pode levar a sons inesperados ou artefactos na voz gerada pela IA.

Casos de Utilização & Benefícios Práticos

  • Marketing & Publicidade
    Os profissionais de marketing gostam de despertar curiosidade com frases curtas e impactantes — muitas vezes seguidas de uma pausa bem cronometrada. Agora pode aperfeiçoar a sua mensagem de marca e testar diferentes entoações sem desperdiçar créditos.
  • E-Learning & Vídeos Educativos
    Termos complexos ou siglas são comuns em conteúdos educativos. Pré-visualize rapidamente como são lidos, insira as pausas certas e garanta que os alunos acompanham facilmente.
  • Narração & Storytelling
    Vozes dramáticas dependem de um ritmo preciso. Uma pausa bem colocada pode transmitir suspense ou emoção — algo que o ritmo automático do TTS nem sempre consegue garantir.
  • Apresentações Profissionais
    Quando precisa de articular um ponto — por exemplo, em análises financeiras ou apresentações empresariais — nomes ou números mal pronunciados podem prejudicar a credibilidade. Pré-visualizar e adicionar pausas ajuda a garantir uma narração suave e profissional.