Experimentá Más Control con las Nuevas Funciones “Previsualización de Audio” y “Pausa”

Jan 12, 2025

Funciones de previsualización de audio y pausa para la creación de contenido en video

La calidad de un video muchas veces depende de los detalles más pequeños—como la pronunciación de una palabra o el momento exacto de una pausa dramática. Nos entusiasma presentarte dos nuevas funciones—Previsualización de Audio y Pausa—que te brindan mayor precisión y flexibilidad antes de generar tu video final.

¿Por qué usar Previsualización de Audio?

Previsualización de Audio es un antes y un después para quienes quieren asegurarse de que la narración por texto a voz (TTS) suene exactamente como desean antes de gastar créditos en la creación del video. Antes, pasabas directamente de escribir tu guion a generar el producto final. Si bien este flujo era práctico, no permitía ajustar detalles—y si notabas un error, ya habías gastado tus créditos. Con Previsualización de Audio, podés:

  1. Verificar Pronunciación y Tono
    Escuchá toda la pista de audio generada a partir de tu texto y asegurate de que coincida con el estilo que buscás.
  2. Ahorrar Créditos
    Detectar un error en el audio antes de renderizar el video te ayuda a evitar gastos innecesarios.
  3. Evitar Artefactos de Streaming
    Cuando el audio se genera en tiempo real para sincronizarse con el video (un “pipeline de streaming”), algunas voces de IA pueden presentar leves inconsistencias de volumen al inicio o al final. Usando primero la Previsualización de Audio, podés evitar estos artefactos y lograr un resultado más pulido.

Errores Comunes y Consideraciones sobre el Texto: Aunque la tecnología TTS ha avanzado mucho, ciertas complejidades pueden seguir presentando desafíos. Prestá especial atención a:

  • Términos Especializados o Técnicos: Jerga médica, legal o científica puede requerir ajustes de puntuación o deletreo.
  • Abreviaturas: Asegurate de que el TTS las expanda o pronuncie correctamente.
  • Monedas y Números: El narrador puede leer los números en un formato inesperado o ignorar los símbolos de moneda.
  • Puntuación Abundante: Puntos, comas y dos puntos influyen en la entonación y el ritmo del TTS.

Si notás algún problema, simplemente corregí tu texto, ejecutá la Previsualización de Audio nuevamente y confirmá que todo esté perfecto antes de hacer clic en “Generar Video Hablado”.

Presentamos la Función de Pausa

A veces querés bajar el ritmo para lograr un efecto dramático, enfatizar una frase o pronunciar palabras difíciles con precisión. Nuestra nueva opción de Pausa—accesible mediante el ícono “⏱ +0.5”—te permite insertar una breve pausa en cualquier parte de tu guion. Si necesitás una pausa más larga, simplemente agregá varios íconos de pausa en tu texto. Esta pausa manual puede:

  • Mejorar la Claridad: Separá oraciones largas para que el oyente comprenda cada segmento con claridad.
  • Realzar la Énfasis: Generá expectativa antes de una afirmación clave o un remate humorístico.
  • Controlar las Pausas del TTS: Si el motor de texto a voz no pausa donde querés—o agrega una pausa no deseada—al agregar pausas manualmente te asegurás de que la narración final fluya como imaginás.

Consejos Importantes

Previsualización de Audio utiliza una cuota basada en caracteres, que se reinicia mensualmente según tu plan de suscripción. Como referencia, 1 minuto de audio equivale aproximadamente a 1.000 caracteres:

  • Gratis: 500 caracteres (~0,5 min de audio)
  • Lite: 1.000 caracteres (~1 min de audio)
  • Pro: 10.000 caracteres (~10 min de audio)
  • Advanced: 50.000 caracteres (~50 min de audio)
  • Ultra: 100.000 caracteres (~100 min de audio)

Consejos para la función de Pausa (Stopwatch):

  • Al usar la función de pausa, cada ícono representa una pausa de 0,5 segundos, y podés usarlos consecutivamente para crear pausas más largas, hasta un máximo de 3 segundos.
  • Recordá: Evitá usar más de dos pausas consecutivas dentro de un mismo segmento de texto, ya que esto puede hacer que la IA genere sonidos inesperados o artefactos.

Casos de Uso y Beneficios Reales

  • Marketing y Publicidad
    A quienes trabajan en marketing les encanta despertar curiosidad con frases cortas e impactantes—muchas veces seguidas de una pausa bien ubicada. Ahora podés perfeccionar tu mensaje de marca y probar diferentes entonaciones sin desperdiciar créditos.
  • E-Learning y Videos Educativos
    Los términos complejos o siglas son habituales en contenidos educativos. Previsualizá rápidamente cómo se leen, insertá las pausas adecuadas y asegurate de que quienes aprenden puedan seguir el ritmo cómodamente.
  • Narración y Storytelling
    Las narraciones dramáticas dependen de un ritmo preciso. Una pausa bien colocada puede transmitir suspenso o matices emocionales—algo que el ritmo automático del TTS no siempre logra por sí solo.
  • Presentaciones Profesionales
    Cuando necesitás explicar un punto—por ejemplo, en informes financieros o presentaciones corporativas—los nombres o números mal pronunciados pueden afectar la credibilidad. Previsualizar y agregar pausas ayuda a garantizar una pista de voz fluida y profesional.