Audio & Stimme

Welche Sprachen werden unterstützt?
Wir unterstützen über 30 wichtige Sprachen weltweit, darunter unter anderem: Englisch, Chinesisch, Spanisch, Arabisch, Portugiesisch, Russisch, Japanisch, Punjabi, Deutsch, Französisch, Koreanisch, Türkisch, Tamil, Vietnamesisch, Hindi, Bengalisch, Urdu, Persisch, Italienisch, Indonesisch, Thailändisch, Marathi, Telugu, Ukrainisch, Malaiisch, Rumänisch, Polnisch, Niederländisch, Gujarati und Kannada.
Wie viele Stimmen sind in der Voice-Bibliothek von VisionStory verfügbar und kann ich diese anpassen?
VisionStory bietet über 200 Stimmen in der Bibliothek, die nach Geschlecht, Alter und Anwendungsfall gefiltert werden können. Falls Sie keine passende Stimme finden, können Sie zudem eine eigene KI-Stimmen-Kopie erstellen, indem Sie eine Audiodatei hochladen oder direkt aufnehmen.
Warum gibt es in meiner Sprache weniger Stimmoptionen?
Die begrenzte Anzahl an Stimmen in bestimmten Sprachen ist darauf zurückzuführen, dass diese Stimmen speziell für diese Sprachen optimiert wurden. Allerdings ermöglicht die zugrundeliegende Sprachunterstützung, dass beispielsweise englische Stimmen auch mehrere andere Sprachen sprechen können, was Ihnen mehr Flexibilität bei der Auswahl bietet.
Was ist Voice Cloning und wie kann ich eine Stimme klonen?
Voice Cloning ermöglicht es dir, eine individuelle KI-Stimme zu erstellen, die eine bestimmte Stimme nachahmt, indem du eine Audioaufnahme hochlädst oder direkt aufnimmst. Um eine Stimme zu klonen, achte darauf, dass die Aufnahme klar und in einer ruhigen Umgebung gemacht wird, um optimale Ergebnisse zu erzielen.
Ist das Klonen von Stimmen kostenlos?
Um die Sprachklon-Funktion für die Videogenerierung zu nutzen, benötigen Sie ein Pro-Abo oder höher.
Wie viele Sprachen werden beim Voice Cloning unterstützt?
Voice Cloning wird in mehr als 32 Sprachen kostenlos unterstützt. Die Liste der unterstützten Sprachen kann sich ändern – bitte prüfen Sie die Voice Cloning-Funktion für die aktuellsten Optionen. Bitte beachten Sie: Obwohl das Clonen kostenlos ist, benötigen Sie ein Abonnement, um die geklonte Stimme in Videos zu verwenden.
Was ist Vorschau-Audio und welche Vorteile bietet es?
Vorschau-Audio ermöglicht es dir, die Sprache für dein Talking-Video vor der endgültigen Videoproduktion zu generieren. Mit dieser Funktion kannst du Stimme, Aussprache und Pausen überprüfen, um sicherzustellen, dass alles deinen Erwartungen entspricht. Du kannst die Stimme anpassen, bevor du das Video generierst. Für alle Abonnenten ist diese Funktion kostenlos nutzbar, das Vorschau-Kontingent wird täglich zurückgesetzt. Wenn du das tägliche Vorschau-Kontingent erreichst, kannst du zusätzliches Kontingent mit Credits kaufen.
Was bedeutet das Stoppuhr-Symbol und +0.5s?
Das Stoppuhr-Symbol und die Funktion +0.5s ermöglichen es dir, eine Pause von 0,5 Sekunden in die generierte Stimme einzufügen. Du kannst mehrere Stoppuhr-Symbole hintereinander setzen, um längere Pausen in deinem Video zu erstellen.
Was ist der URL-Import und welche URLs werden unterstützt?
Mit dem URL-Import kannst du Audio von einem Link importieren, indem die Audiospur von der angegebenen URL heruntergeladen und für die Videogenerierung verwendet wird. Aktuell werden Links von YouTube und TikTok unterstützt. Wenn du Unterstützung für weitere Plattformen wünschst, kontaktiere uns bitte. Zusätzlich kannst du die Voice Changer-Funktion nutzen, um das importierte Audio zu verändern, während der Originalinhalt erhalten bleibt.
Was ist die Funktion „Rauschentfernung“?
Die Funktion „Rauschentfernung“ hilft dabei, Hintergrundgeräusche aus Audiodateien zu entfernen, wenn Sie diese importieren oder aufnehmen, sodass die Tonqualität Ihrer Videos klarer wird. Für die Nutzung dieser Funktion benötigen Sie mindestens ein Pro-Abo.
Was ist die Voice Changer-Funktion?
Die Voice Changer-Funktion ermöglicht es dir, die Stimme in einer Sprachaufnahme zu verändern, sodass du einzigartige Versionen des Audios erstellen kannst, während der ursprüngliche Inhalt erhalten bleibt. Diese Funktion ist für alle Nutzer:innen mit einem Pro-Plan oder höher verfügbar.
Kann ich die Emotion der Stimme steuern?
Die Emotion in der Stimme wird durch den von Ihnen eingegebenen Text vermittelt. Je nachdem, welchen Text Sie verwenden, wendet das Text-zu-Sprache-System (TTS) automatisch die passende Emotion an – eine zusätzliche Steuerung ist nicht nötig.
Was sollte ich beim Einsatz der Stoppuhr- (Pause-) Funktion beachten?
Jede Stoppuhr steht für eine Pause von 0,5 Sekunden, und Sie können mehrere hintereinander verwenden, um längere Pausen von bis zu maximal 3 Sekunden zu erzeugen. Vermeiden Sie jedoch, mehr als zwei Pausen direkt hintereinander in einem Textabschnitt zu setzen, da dies dazu führen kann, dass die KI unerwartete Geräusche oder Artefakte erzeugt.