Disfruta de mayor control con las nuevas funciones “Previsualización de Audio” y “Pausa”

Jan 11, 2025

Funciones de previsualización de audio y pausa para la creación de vídeos

La creación de contenido de vídeo de alta calidad a menudo depende de los detalles más pequeños, como la pronunciación de una palabra o el momento exacto de una pausa dramática. Nos complace presentar dos nuevas funciones—Previsualización de Audio y Pausa—que te ofrecen mayor precisión y flexibilidad antes de generar tu vídeo definitivo.

¿Por qué usar la Previsualización de Audio?

Previsualización de Audio es una función revolucionaria para quienes desean asegurarse de que la narración por texto a voz (TTS) suene exactamente como desean antes de gastar créditos en la creación de un vídeo. Antes, pasabas directamente de escribir tu guion a generar el producto final. Aunque este flujo era cómodo, no permitía afinar detalles y, si detectabas un pequeño error, ya habrías consumido tus créditos. Con la Previsualización de Audio puedes:

  1. Verificar pronunciación y entonación
    Escucha toda la pista de audio generada a partir de tu texto y asegúrate de que se ajusta al estilo que buscas.
  2. Ahorrar créditos
    Detectar un error en el audio antes de renderizar el vídeo te ayuda a evitar gastos innecesarios.
  3. Evitar artefactos de streaming
    Cuando el audio se genera en tiempo real para sincronizarse con el vídeo (lo que se conoce como “streaming pipeline”), algunas voces de IA pueden presentar ligeras inconsistencias de volumen al principio y al final. Usando primero la Previsualización de Audio, puedes evitar estos artefactos y obtener un resultado final más pulido.

Errores comunes y consideraciones sobre el texto: Aunque la tecnología TTS ha avanzado mucho, ciertas complejidades pueden seguir suponiendo un reto. Presta especial atención a:

  • Términos especializados o técnicos: El vocabulario médico, legal o científico puede requerir ajustes adicionales de puntuación o deletreo.
  • Abreviaturas: Asegúrate de que el TTS las expanda o pronuncie correctamente.
  • Monedas y números: El narrador podría leer los números en un formato inesperado o ignorar los símbolos de moneda.
  • Puntuación abundante: Los puntos, comas y dos puntos influyen en la entonación y el ritmo del TTS.

Si detectas algún problema, simplemente revisa tu texto, ejecuta de nuevo la Previsualización de Audio y confirma que todo está perfecto antes de pulsar “Generar vídeo hablado”.

Presentamos la función de Pausa

A veces quieres ralentizar el ritmo para dar énfasis, destacar una frase o pronunciar palabras complejas con precisión. Nuestra nueva opción Pausa—accesible mediante el icono “⏱ +0,5”—te permite insertar una breve pausa en cualquier parte de tu guion. Si necesitas una pausa más larga, solo tienes que añadir varios iconos de pausa en tu texto. Esta pausa manual puede:

  • Mejorar la claridad: Divide frases largas para que el oyente comprenda claramente cada segmento.
  • Potenciar el énfasis: Crea expectación antes de una declaración clave o un remate humorístico.
  • Sustituir las pausas predeterminadas del TTS: Si el motor de texto a voz no pausa donde deseas—o añade una pausa no deseada—añadir pausas manualmente garantiza que la narración final fluya como tú quieres.

Consejos importantes

Previsualización de Audio utiliza una cuota basada en caracteres, que se reinicia mensualmente según tu plan de suscripción. Como referencia general, 1 minuto de audio equivale aproximadamente a 1.000 caracteres:

  • Pro: 10.000 caracteres (~10 min de audio)
  • Advanced: 50.000 caracteres (~50 min de audio)
  • Ultra: 100.000 caracteres (~100 min de audio)

Consejos para la función de cronómetro:

  • Al usar la función de cronómetro, cada cronómetro representa una pausa de 0,5 segundos, y puedes usarlos de forma consecutiva para crear pausas más largas, hasta un máximo de 3 segundos.
  • Recuerda: Evita usar más de dos pausas consecutivas dentro de un mismo segmento de texto, ya que esto puede provocar que la IA genere sonidos o artefactos inesperados.

Casos de uso y beneficios reales

  • Marketing y publicidad
    A los profesionales del marketing les encanta despertar la curiosidad con frases breves e impactantes, a menudo seguidas de una pausa bien calculada. Ahora puedes perfeccionar el mensaje de tu marca y previsualizar diferentes entonaciones sin malgastar créditos.
  • E-learning y vídeos educativos
    La terminología compleja o los acrónimos son habituales en el contenido educativo. Previsualiza rápidamente cómo se pronuncian, inserta las pausas adecuadas y asegúrate de que los alumnos puedan seguir el contenido cómodamente.
  • Narración y storytelling
    Las locuciones dramáticas dependen de un ritmo preciso. Una pausa bien colocada puede transmitir suspense o matices emocionales—algo que el ritmo automático del TTS no siempre consigue por sí solo.
  • Presentaciones profesionales
    Cuando necesitas explicar un punto—por ejemplo, en revisiones financieras o presentaciones corporativas—los nombres o números mal pronunciados pueden restar credibilidad. Previsualizar y añadir pausas ayuda a garantizar una pista de voz fluida y profesional.