Erleben Sie mehr Kontrolle mit unseren neuen „Vorschau-Audio“- und „Pause“-Funktionen
Jan 11, 2025

Hochwertige Videoinhalte entstehen oft durch die kleinen Details – wie die Aussprache eines Wortes oder das Timing einer dramatischen Pause. Wir freuen uns, zwei neue Funktionen vorzustellen – Vorschau-Audio und Pause –, die Ihnen noch mehr Präzision und Flexibilität bieten, bevor Sie endgültig ein Video generieren.
Warum Vorschau-Audio?
Vorschau-Audio ist ein echter Gamechanger für alle, die sicherstellen möchten, dass ihre Text-zu-Sprache (TTS)-Erzählung perfekt klingt, bevor Credits für die Videoerstellung verbraucht werden. Bisher ging es direkt vom Skript zur Videogenerierung – bequem, aber wenig Raum für Feinschliff. Wurde ein kleiner Fehler entdeckt, waren die Credits bereits verbraucht. Mit Vorschau-Audio können Sie:
- Aussprache & Ton überprüfen
Hören Sie sich die komplette Audiospur an, die aus Ihrem Text generiert wurde, und stellen Sie sicher, dass sie Ihrem gewünschten Stil entspricht. - Credits sparen
Fehler im Audio vor der Videorenderung zu erkennen, hilft Ihnen, unnötige Ausgaben zu vermeiden. - Streaming-Artefakte vermeiden
Wenn Audio in Echtzeit zur Videosynchronisation generiert wird („Streaming-Pipeline“), können manche KI-Stimmen zu Beginn oder am Ende leichte Lautstärkeschwankungen aufweisen. Mit Vorschau-Audio umgehen Sie diese Artefakte und erzielen ein professionelleres Endergebnis.
Typische Stolpersteine & Text-Tipps: Obwohl TTS-Technologie große Fortschritte gemacht hat, gibt es noch Herausforderungen. Achten Sie besonders auf:
- Spezialisierte oder technische Begriffe: Medizinische, juristische oder wissenschaftliche Fachbegriffe benötigen eventuell zusätzliche Satzzeichen oder Anpassungen in der Schreibweise.
- Abkürzungen: Prüfen Sie, ob TTS diese korrekt ausspricht oder ausschreibt.
- Währungen & Zahlen: Die Stimme könnte Zahlen in unerwarteten Formaten sprechen oder Währungssymbole übergehen.
- Starke Zeichensetzung: Punkte, Kommas und Doppelpunkte beeinflussen Intonation und Sprechtempo.
Wenn Sie Probleme bemerken, überarbeiten Sie einfach Ihren Text, nutzen Sie Vorschau-Audio erneut und bestätigen Sie, dass alles passt, bevor Sie auf „Sprechendes Video generieren“ klicken.
Die neue Pausenfunktion
Manchmal möchten Sie das Tempo für einen dramatischen Effekt verlangsamen, eine Aussage betonen oder schwierige Wörter gezielt hervorheben. Unsere neue Pause-Option – erreichbar über das Symbol „⏱ +0,5“ – ermöglicht es Ihnen, an jeder beliebigen Stelle im Skript eine kurze Pause einzufügen. Für längere Pausen fügen Sie einfach mehrere Pausensymbole ein. Diese manuelle Pause kann:
- Die Verständlichkeit verbessern: Lange Sätze werden aufgeteilt, sodass Zuhörer jeden Abschnitt klar erfassen.
- Die Betonung verstärken: Erzeugen Sie Spannung vor einer wichtigen Aussage oder Pointe.
- Standard-TTS-Pausen überschreiben: Wenn die TTS-Engine nicht dort pausiert, wo Sie es wünschen – oder unerwünschte Pausen einfügt –, sorgen manuelle Pausen für den gewünschten Sprachfluss.
Wichtige Hinweise
Vorschau-Audio verwendet ein zeichenbasiertes Kontingent, das sich monatlich je nach Abonnement zurücksetzt. Als Faustregel gilt: 1 Minute Sprache entspricht etwa 1.000 Zeichen:
- Pro: 10.000 Zeichen (~10 Minuten Audio)
- Advanced: 50.000 Zeichen (~50 Minuten Audio)
- Ultra: 100.000 Zeichen (~100 Minuten Audio)
Tipps zur Stoppuhrfunktion:
- Jede Stoppuhr steht für eine Pause von 0,5 Sekunden. Sie können mehrere hintereinander verwenden, um Pausen bis zu maximal 3 Sekunden zu erzeugen.
- Hinweis: Vermeiden Sie mehr als zwei aufeinanderfolgende Pausen in einem Textabschnitt, da dies zu unerwarteten Geräuschen oder Artefakten führen kann.
Anwendungsfälle & praktische Vorteile
- Marketing & Werbung
Marketer erzeugen Neugier mit kurzen, prägnanten Aussagen – oft gefolgt von einer gezielten Pause. Jetzt können Sie Ihre Markenbotschaft perfektionieren und verschiedene Varianten vorab anhören, ohne Credits zu verschwenden. - E-Learning & Schulungsvideos
Komplexe Begriffe oder Abkürzungen sind im Bildungsbereich üblich. Prüfen Sie schnell, wie diese ausgesprochen werden, fügen Sie passende Pausen ein und sorgen Sie dafür, dass Lernende problemlos folgen können. - Storytelling & Erzählungen
Dramatische Voiceovers leben von präzisem Timing. Eine gezielt gesetzte Pause kann Spannung oder Emotionen transportieren – etwas, das die automatische TTS-Vertonung nicht immer perfekt trifft. - Professionelle Präsentationen
Wenn Sie einen Punkt verdeutlichen möchten – etwa bei Finanzberichten oder Unternehmenspräsentationen – können falsch ausgesprochene Namen oder Zahlen die Glaubwürdigkeit beeinträchtigen. Mit Vorschau und Pausen sorgen Sie für einen reibungslosen, professionellen Sprachtrack.