Profitez d’un contrôle accru grâce aux nouvelles fonctions « Aperçu Audio » et « Pause »
Jan 12, 2025

La création de contenu vidéo de haute qualité repose souvent sur les plus petits détails — comme la prononciation d’un mot ou le moment précis d’une pause dramatique. Nous sommes ravis de vous présenter deux nouvelles fonctionnalités — Aperçu Audio et Pause — qui vous offrent plus de précision et de flexibilité avant de générer une vidéo complète.
Pourquoi utiliser l’Aperçu Audio ?
Aperçu Audio révolutionne la façon de valider la narration en synthèse vocale (TTS) avant d’utiliser vos crédits pour générer une vidéo. Auparavant, vous passiez directement de la rédaction de votre script à la génération du produit final. Ce processus était pratique, mais laissait peu de place aux ajustements — et si vous remarquiez une petite erreur, vos crédits étaient déjà dépensés. Avec l’Aperçu Audio, vous pouvez :
- Vérifier la prononciation et le ton
Écoutez la piste audio générée à partir de votre texte et assurez-vous qu’elle correspond au style souhaité. - Économiser des crédits
Détecter une erreur dans l’audio avant de générer la vidéo vous évite des dépenses inutiles. - Éviter les artefacts de streaming
Lorsque l’audio est généré en temps réel pour synchroniser avec la vidéo (pipeline de streaming), certaines voix IA peuvent présenter de légères variations de volume au début ou à la fin. En utilisant d’abord l’Aperçu Audio, vous contournez ces artefacts et obtenez un résultat final plus professionnel.
Pièges courants et points d’attention pour le texte : Même si la technologie TTS a beaucoup évolué, certaines subtilités peuvent encore poser problème. Soyez attentif à :
- Termes spécialisés ou techniques : Le jargon médical, juridique ou scientifique peut nécessiter une ponctuation ou une orthographe adaptée.
- Abréviations : Vérifiez que la synthèse vocale les développe ou les prononce correctement.
- Devises et chiffres : Le narrateur peut lire les chiffres dans un format inattendu ou ignorer les symboles monétaires.
- Ponctuation abondante : Les points, virgules et deux-points influencent l’intonation et le rythme de la voix.
Si vous remarquez un problème, modifiez simplement votre texte, relancez l’Aperçu Audio et confirmez que tout est parfait avant de cliquer sur « Générer une vidéo parlante ».
Présentation de la fonction Pause
Parfois, vous souhaitez ralentir le rythme pour créer un effet dramatique, mettre l’accent sur une phrase ou prononcer certains mots avec précision. Notre nouvelle option Pause — accessible via l’icône « ⏱ +0,5 » — vous permet d’insérer une courte pause n’importe où dans votre script. Pour une pause plus longue, il suffit d’ajouter plusieurs icônes de pause dans votre texte. Cette pause manuelle permet de :
- Améliorer la clarté : Découpez les phrases longues pour que l’auditeur comprenne chaque segment distinctement.
- Renforcer l’emphase : Créez de l’attente avant une déclaration clé ou une chute humoristique.
- Remplacer les pauses automatiques du TTS : Si la synthèse vocale ne fait pas de pause où vous le souhaitez — ou en ajoute une de façon inattendue —, l’ajout manuel de pauses garantit que la narration finale suit votre intention.
Conseils importants
L’Aperçu Audio utilise un quota basé sur le nombre de caractères, qui se renouvelle chaque mois selon votre forfait. À titre indicatif, 1 minute de parole correspond à environ 1 000 caractères :
- Gratuit : 500 caractères (~0,5 min d’audio)
- Lite : 1 000 caractères (~1 min d’audio)
- Pro : 10 000 caractères (~10 min d’audio)
- Avancé : 50 000 caractères (~50 min d’audio)
- Ultra : 100 000 caractères (~100 min d’audio)
Conseils pour la fonction chronomètre (pause) :
- Chaque icône de chronomètre représente une pause de 0,5 seconde. Vous pouvez les utiliser consécutivement pour créer des pauses plus longues, jusqu’à un maximum de 3 secondes.
- Rappel : Évitez d’utiliser plus de deux pauses consécutives dans un même segment de texte, car cela pourrait entraîner des sons inattendus ou des artefacts dans l’audio généré par l’IA.
Cas d’utilisation et avantages concrets
- Marketing et publicité
Les spécialistes du marketing aiment susciter la curiosité avec des phrases courtes et percutantes — souvent suivies d’une pause bien placée. Vous pouvez désormais peaufiner vos messages de marque et tester différentes intonations sans gaspiller de crédits. - Formation et vidéos éducatives
Les contenus pédagogiques comportent souvent des termes complexes ou des acronymes. Prévisualisez rapidement leur prononciation, insérez les bonnes pauses et assurez-vous que les apprenants suivent facilement. - Récits et narration
Les voix-off dramatiques reposent sur un rythme précis. Une pause bien placée peut transmettre du suspense ou une émotion — ce que le rythme automatique du TTS ne garantit pas toujours. - Présentations professionnelles
Lorsqu’il s’agit d’exposer un point — par exemple lors d’une revue financière ou d’un pitch d’entreprise —, une mauvaise prononciation de noms ou de chiffres peut nuire à la crédibilité. Prévisualiser et ajouter des pauses permet d’obtenir une narration fluide et professionnelle.