Wir unterstützen über 30 wichtige Sprachen weltweit, darunter unter anderem: Englisch, Chinesisch, Spanisch, Arabisch, Portugiesisch, Russisch, Japanisch, Punjabi, Deutsch, Französisch, Koreanisch, Türkisch, Tamil, Vietnamesisch, Hindi, Bengalisch, Urdu, Persisch, Italienisch, Indonesisch, Thailändisch, Marathi, Telugu, Ukrainisch, Malaiisch, Rumänisch, Polnisch, Niederländisch, Gujarati und Kannada.
Wie viele Stimmen sind in der Voice-Bibliothek von VisionStory verfügbar und kann ich diese anpassen?
VisionStory bietet über 200 Stimmen in der Bibliothek, die nach Geschlecht, Alter und Anwendungsfall gefiltert werden können. Falls Sie keine passende Stimme finden, können Sie zudem eine eigene KI-Stimmen-Kopie erstellen, indem Sie eine Audiodatei hochladen oder direkt aufnehmen.
Warum gibt es in meiner Sprache weniger Stimmoptionen?
Die begrenzte Anzahl an Stimmen in bestimmten Sprachen ist darauf zurückzuführen, dass diese Stimmen speziell für diese Sprachen optimiert wurden. Allerdings ermöglicht die zugrundeliegende Sprachunterstützung, dass beispielsweise englische Stimmen auch mehrere andere Sprachen sprechen können, was Ihnen mehr Flexibilität bei der Auswahl bietet.
Was ist Voice Cloning und wie kann ich eine Stimme klonen?
Voice Cloning ermöglicht es dir, eine individuelle KI-Stimme zu erstellen, die eine bestimmte Stimme nachahmt, indem du eine Audioaufnahme hochlädst oder direkt aufnimmst. Um eine Stimme zu klonen, achte darauf, dass die Aufnahme klar und in einer ruhigen Umgebung gemacht wird, um optimale Ergebnisse zu erzielen.
Ist das Klonen von Stimmen kostenlos?
Das Klonen von Stimmen ist für Englisch, Spanisch, Japanisch und Chinesisch kostenlos, sodass du testen kannst, ob die geklonte Stimme deiner eigenen ähnelt. Um die geklonte Stimme jedoch für die Videogenerierung zu verwenden, benötigst du ein Pro-Abo oder höher. Für das Klonen von Stimmen in anderen Sprachen als diesen vier ist ebenfalls mindestens ein Pro-Abo erforderlich.
Wie viele Sprachen werden beim Voice Cloning unterstützt?
Voice Cloning wird kostenlos in vier Sprachen unterstützt: Englisch, Spanisch, Japanisch und Chinesisch. Weitere Sprachen sind verfügbar, erfordern jedoch mindestens ein Pro-Abo. Die Liste der unterstützten Sprachen kann sich ändern – bitte prüfen Sie die Voice-Cloning-Funktion für die aktuellsten Optionen.
Was ist Vorschau-Audio und welche Vorteile bietet es?
Vorschau-Audio ermöglicht es dir, die Sprachausgabe für dein Talking-Video vor der endgültigen Videoproduktion zu generieren. Mit dieser Funktion kannst du Stimme, Aussprache und Pausen überprüfen, um sicherzustellen, dass alles deinen Erwartungen entspricht. Du kannst die Stimme anpassen, bevor du das Video generierst, was Credits kostet. Um Vorschau-Audio zu nutzen, benötigst du mindestens ein Pro-Abo; je nach Abo stehen dir unterschiedliche Vorschau-Kontingente zur Verfügung.
Was bedeutet das Stoppuhr-Symbol und +0.5s?
Das Stoppuhr-Symbol und die Funktion +0.5s ermöglichen es dir, eine Pause von 0,5 Sekunden in die generierte Stimme einzufügen. Du kannst mehrere Stoppuhr-Symbole hintereinander setzen, um längere Pausen in deinem Video zu erstellen.
Was ist der URL-Import und welche URLs werden unterstützt?
Mit dem URL-Import kannst du Audio von einem Link importieren, indem die Audiospur von der angegebenen URL heruntergeladen und für die Videogenerierung verwendet wird. Aktuell werden Links von YouTube und TikTok unterstützt. Wenn du Unterstützung für weitere Plattformen wünschst, kontaktiere uns bitte. Zusätzlich kannst du die Voice Changer-Funktion nutzen, um das importierte Audio zu verändern, während der Originalinhalt erhalten bleibt.
Was ist die Funktion „Rauschentfernung“?
Die Funktion „Rauschentfernung“ hilft dabei, Hintergrundgeräusche aus Audiodateien zu entfernen, wenn Sie diese importieren oder aufnehmen, sodass die Tonqualität Ihrer Videos klarer wird. Für die Nutzung dieser Funktion benötigen Sie mindestens ein Pro-Abo.
Was ist die Voice Changer-Funktion?
Die Voice Changer-Funktion ermöglicht es dir, die Stimme in einer Sprachaufnahme zu verändern, sodass du einzigartige Versionen des Audios erstellen kannst, während der ursprüngliche Inhalt erhalten bleibt. Diese Funktion ist für alle Nutzer:innen mit einem Pro-Plan oder höher verfügbar.
Kann ich die Emotion der Stimme steuern?
Die Emotion in der Stimme wird durch den von Ihnen eingegebenen Text vermittelt. Je nachdem, welchen Text Sie verwenden, wendet das Text-zu-Sprache-System (TTS) automatisch die passende Emotion an – eine zusätzliche Steuerung ist nicht nötig.
Was sollte ich beim Einsatz der Stoppuhr- (Pause-) Funktion beachten?
Jede Stoppuhr steht für eine Pause von 0,5 Sekunden, und Sie können mehrere hintereinander verwenden, um längere Pausen von bis zu maximal 3 Sekunden zu erzeugen. Vermeiden Sie jedoch, mehr als zwei Pausen direkt hintereinander in einem Textabschnitt zu setzen, da dies dazu führen kann, dass die KI unerwartete Geräusche oder Artefakte erzeugt.