Profitez d’un meilleur contrôle grâce aux nouvelles fonctions « Aperçu Audio » et « Pause »

Jan 11, 2025

Fonctionnalités d’aperçu audio et de pause pour la création de contenu vidéo

La création de contenu vidéo de haute qualité repose souvent sur les plus petits détails—comme la prononciation d’un mot ou le moment d’une pause dramatique. Nous sommes ravis de vous présenter deux nouvelles fonctionnalités—Aperçu Audio et Pause—qui vous offrent plus de précision et de flexibilité avant de générer votre vidéo finale.

Pourquoi utiliser l’Aperçu Audio ?

Aperçu Audio révolutionne la façon de valider votre narration en synthèse vocale (TTS) avant d’utiliser vos crédits pour créer une vidéo. Auparavant, vous passiez directement de la rédaction du script à la génération du produit final. Ce processus était rapide, mais laissait peu de place aux ajustements—et si vous remarquiez une erreur, vos crédits étaient déjà dépensés. Avec l’Aperçu Audio, vous pouvez :

  1. Vérifier la prononciation et le ton
    Écoutez la piste audio générée à partir de votre texte et assurez-vous qu’elle correspond au style recherché.
  2. Économiser vos crédits
    Détecter une erreur dans l’audio avant de générer la vidéo vous évite des dépenses inutiles.
  3. Éviter les artefacts de streaming
    Lorsque l’audio est généré en temps réel pour synchroniser avec la vidéo (pipeline de streaming), certaines voix IA peuvent présenter de légères variations de volume au début ou à la fin. En utilisant l’Aperçu Audio, vous pouvez éviter ces artefacts et obtenir un résultat final plus soigné.

Pièges courants et points à surveiller : Même si la technologie TTS a beaucoup évolué, certaines subtilités peuvent encore poser problème. Portez une attention particulière à :

  • Termes spécialisés ou techniques : Le jargon médical, juridique ou scientifique peut nécessiter une ponctuation ou une orthographe adaptée.
  • Abréviations : Vérifiez que la synthèse vocale les prononce ou les développe correctement.
  • Devises et chiffres : Le narrateur peut lire les chiffres dans un format inattendu ou ignorer les symboles monétaires.
  • Ponctuation abondante : Les points, virgules et deux-points influencent l’intonation et le rythme de la narration.

Si vous remarquez un problème, modifiez simplement votre texte, relancez l’Aperçu Audio et confirmez que tout est parfait avant de cliquer sur « Générer une vidéo parlante ».

Présentation de la fonction Pause

Parfois, vous souhaitez ralentir le rythme pour créer un effet dramatique, mettre en valeur une phrase ou gérer la prononciation de mots complexes. Notre nouvelle option Pause—accessible via l’icône « ⏱ +0,5 »—vous permet d’insérer une courte pause n’importe où dans votre script. Pour une pause plus longue, ajoutez simplement plusieurs icônes de pause dans votre texte. Cette pause manuelle peut :

  • Améliorer la clarté : Séparez les phrases longues pour que l’auditeur comprenne chaque segment.
  • Renforcer l’emphase : Créez de l’anticipation avant une déclaration clé ou une chute humoristique.
  • Remplacer les pauses par défaut du TTS : Si la synthèse vocale ne fait pas de pause où vous le souhaitez—ou en ajoute une de façon inattendue—l’ajout manuel de pauses garantit que la narration finale suit votre intention.

Conseils importants

Aperçu Audio fonctionne avec un quota basé sur le nombre de caractères, qui se réinitialise chaque mois selon votre forfait. À titre indicatif, 1 minute de parole équivaut à environ 1 000 caractères :

  • Pro : 10 000 caractères (~10 min d’audio)
  • Avancé : 50 000 caractères (~50 min d’audio)
  • Ultra : 100 000 caractères (~100 min d’audio)

Conseils pour la fonction Chronomètre :

  • Chaque icône de chronomètre représente une pause de 0,5 seconde. Vous pouvez les utiliser consécutivement pour créer des pauses plus longues, jusqu’à un maximum de 3 secondes.
  • Rappel : Évitez d’utiliser plus de deux pauses consécutives dans un même segment de texte, car cela peut entraîner des sons ou artefacts inattendus de la part de l’IA.

Cas d’utilisation et avantages concrets

  • Marketing et publicité
    Les spécialistes du marketing aiment susciter la curiosité avec des phrases courtes et percutantes—souvent suivies d’une pause bien placée. Vous pouvez maintenant peaufiner vos messages de marque et tester différentes intonations sans gaspiller de crédits.
  • Formation et vidéos éducatives
    Les contenus pédagogiques comportent souvent des termes complexes ou des acronymes. Prévisualisez rapidement leur prononciation, insérez les bonnes pauses et assurez-vous que les apprenants suivent facilement.
  • Récits et narration
    Les voix-off dramatiques reposent sur un rythme précis. Une pause bien placée peut transmettre du suspense ou une émotion—ce que le rythme automatique du TTS ne garantit pas toujours.
  • Présentations professionnelles
    Lorsqu’il s’agit d’expliquer un point—par exemple lors d’une revue financière ou d’un pitch d’entreprise—une mauvaise prononciation de noms ou de chiffres peut nuire à votre crédibilité. Prévisualiser et ajouter des pauses permet d’obtenir une narration fluide et professionnelle.