Bénéficiez d’un contrôle accru grâce aux nouvelles fonctionnalités « Aperçu Audio » et « Pause »

Jan 12, 2025

Fonctionnalités d’aperçu audio et de pause pour la création de contenu vidéo

La qualité d’un contenu vidéo se joue souvent sur des détails subtils — comme la prononciation d’un mot ou le timing d’une pause dramatique. Nous sommes ravis de vous présenter deux nouvelles fonctionnalités — Aperçu Audio et Pause — qui vous offrent plus de précision et de flexibilité avant de générer votre vidéo finale.

Pourquoi utiliser l’Aperçu Audio ?

Aperçu Audio révolutionne la création vidéo pour tous ceux qui souhaitent s’assurer que la narration en synthèse vocale (TTS) est parfaite avant d’utiliser leurs crédits. Auparavant, vous passiez directement de la rédaction du script à la génération du produit final. Ce processus était rapide, mais laissait peu de place aux ajustements — et la moindre erreur vous coûtait déjà des crédits. Grâce à l’Aperçu Audio, vous pouvez :

  1. Vérifier la prononciation et le ton
    Écoutez l’intégralité de la piste audio générée à partir de votre texte et assurez-vous qu’elle correspond au style souhaité.
  2. Économiser des crédits
    Détecter une erreur dans l’audio avant de lancer la vidéo vous évite des dépenses inutiles.
  3. Éviter les artefacts de streaming
    Lorsque l’audio est généré à la volée pour synchroniser avec la vidéo (pipeline de streaming), certaines voix IA peuvent présenter de légères variations de volume au début ou à la fin. En utilisant d’abord l’Aperçu Audio, vous contournez ces artefacts et obtenez un résultat plus professionnel.

Points de vigilance et conseils sur le texte : Bien que la technologie TTS ait beaucoup progressé, certaines subtilités peuvent encore poser problème. Soyez attentif à :

  • Termes spécialisés ou techniques : Le jargon médical, juridique ou scientifique peut nécessiter des ajustements de ponctuation ou d’orthographe.
  • Abréviations : Vérifiez que la TTS les développe ou les prononce correctement.
  • Devises et nombres : Le narrateur peut lire les chiffres dans un format inattendu ou ignorer les symboles monétaires.
  • Ponctuation abondante : Points, virgules et deux-points influencent l’intonation et le rythme de la TTS.

Si vous constatez un problème, modifiez simplement votre texte, relancez l’Aperçu Audio et validez le résultat avant de cliquer sur « Générer une vidéo parlante ».

Présentation de la fonctionnalité Pause

Parfois, vous souhaitez ralentir le rythme pour créer un effet dramatique, mettre en valeur une phrase ou prononcer un mot difficile avec précision. Notre nouvelle option Pause — accessible via l’icône « ⏱ +0,5 » — vous permet d’insérer une courte pause où vous le souhaitez dans votre script. Pour une pause plus longue, il suffit d’ajouter plusieurs icônes de pause dans votre texte. Cette pause manuelle peut :

  • Améliorer la clarté : Séparez les phrases longues pour que l’auditeur comprenne chaque segment.
  • Renforcer l’emphase : Créez de l’attente avant une déclaration clé ou une chute humoristique.
  • Remplacer les pauses par défaut de la TTS : Si la synthèse vocale ne marque pas la pause souhaitée — ou en ajoute une non désirée —, l’ajout manuel de pauses garantit un rendu conforme à vos attentes.

Conseils importants

L’Aperçu Audio fonctionne avec un quota de caractères, réinitialisé chaque mois selon votre abonnement. À titre indicatif, 1 minute de parole correspond à environ 1 000 caractères :

  • Gratuit : 500 caractères (~0,5 min d’audio)
  • Lite : 1 000 caractères (~1 min d’audio)
  • Pro : 10 000 caractères (~10 min d’audio)
  • Advanced : 50 000 caractères (~50 min d’audio)
  • Ultra : 100 000 caractères (~100 min d’audio)

Conseils pour la fonctionnalité Pause :

  • Chaque icône de pause correspond à une pause de 0,5 seconde. Vous pouvez les utiliser consécutivement pour créer des pauses plus longues, jusqu’à un maximum de 3 secondes.
  • Rappel : Évitez d’utiliser plus de deux pauses consécutives dans un même segment de texte, car cela peut entraîner des sons inattendus ou des artefacts dans la voix générée par l’IA.

Cas d’usage et bénéfices concrets

  • Marketing & Publicité
    Les spécialistes du marketing aiment susciter la curiosité avec des phrases courtes et percutantes, souvent suivies d’une pause bien placée. Vous pouvez désormais peaufiner vos messages et tester différentes intonations sans gaspiller de crédits.
  • E-learning & vidéos pédagogiques
    Les contenus éducatifs regorgent de termes complexes ou d’acronymes. Prévisualisez rapidement leur prononciation, insérez les bonnes pauses et assurez-vous que les apprenants suivent facilement.
  • Storytelling & narration
    Les voix-off dramatiques reposent sur un rythme précis. Une pause bien placée peut transmettre du suspense ou une émotion — ce que le rythme automatique de la TTS ne garantit pas toujours.
  • Présentations professionnelles
    Pour exposer un point clé — lors d’une revue financière ou d’un pitch —, une mauvaise prononciation de noms ou de chiffres peut nuire à votre crédibilité. Prévisualiser et ajouter des pauses assure une narration fluide et professionnelle.