Ljud & röst

Vilka språk stöder ni?
Vi stöder över 30 stora språk världen över, inklusive men inte begränsat till: engelska, kinesiska, spanska, arabiska, portugisiska, ryska, japanska, punjabi, tyska, franska, koreanska, turkiska, tamil, vietnamesiska, hindi, bengali, urdu, persiska, italienska, indonesiska, thailändska, marathi, telugu, ukrainska, malajiska, rumänska, polska, nederländska, gujarati och kannada.
Hur många röster finns tillgängliga i VisionStorys röstbibliotek, och kan jag anpassa dem?
VisionStory erbjuder över 200 röster i sitt bibliotek, som kan filtreras efter kön, ålder och användningsområde. Om du inte hittar en passande röst kan du även skapa en egen AI-röstklon genom att ladda upp eller spela in ljud.
Varför finns det färre röstalternativ på mitt språk?
De begränsade röstalternativen för vissa språk är särskilt anpassade för just de språken. Dock möjliggör den underliggande språkstödet att röster, till exempel de på engelska, kan tala flera olika språk, vilket ger flexibilitet vid val av röst.
Vad är röstkloning och hur kan jag klona en röst?
Röstkloning gör det möjligt att skapa en anpassad AI-röst som efterliknar en specifik röst genom att ladda upp eller spela in ljud. För att klona en röst, se till att ljudet spelas in tydligt i en tyst miljö för bästa resultat.
Är röstkloning gratis?
För att använda röstkloning i videogenerering behöver du prenumerera på Pro-planen eller högre.
Hur många språk stöds för röstkloning?
Röstkloning stöds kostnadsfritt på över 32 språk. Listan över tillgängliga språk kan ändras, så kontrollera gärna röstkloningsfunktionen för de senaste alternativen. Observera: även om kloningen är gratis krävs ett abonnemang för att använda den klonade rösten i videor.
Vad är förhandslyssning av ljud och vilka fördelar har det?
Förhandslyssning av ljud låter dig generera talet för din pratande video innan den slutliga videon skapas. Denna funktion hjälper dig att kontrollera röst, uttal och pauser så att de motsvarar dina förväntningar. Du kan justera rösten innan du skapar videon. För alla prenumeranter är denna funktion gratis att använda, med en daglig kvot som återställs varje dag. Om du når den dagliga kvoten för förhandslyssning kan du köpa mer kvot med krediter.
Vad betyder stoppursikonen och +0,5s?
Stoppursikonen och +0,5s-funktionen låter dig lägga in en paus på 0,5 sekunder i den genererade rösten. Du kan lägga till flera stoppursikoner i följd för att skapa längre pauser vid behov i din video.
Vad är URL-import och vilka URL:er stöds?
URL-import låter dig importera ljud från en länk genom att ladda ner och extrahera ljudet från den angivna URL:en för att använda i videoproduktion. För närvarande stöds länkar från YouTube och TikTok. Om du vill att fler webbplatser ska stödjas, vänligen kontakta oss. Du kan även använda röstförändringsfunktionen för att modifiera det importerade ljudet samtidigt som originalinnehållet behålls.
Vad är funktionen för att ta bort brus?
Funktionen för att ta bort brus hjälper till att eliminera bakgrundsljud från ljudet när du importerar eller spelar in det, vilket ger klarare ljudkvalitet i dina videor. Denna funktion kräver Pro-plan eller högre för att användas.
Vad är röstförändringsfunktionen?
Röstförändringsfunktionen låter dig ändra rösten i ett tal, så att du kan skapa unika versioner av ljudet samtidigt som det ursprungliga innehållet behålls. Denna funktion kräver ett Pro-abonnemang eller högre för att användas.
Kan jag styra röstens känsla?
Känslan i rösten förmedlas genom den text du skriver in. När du använder olika texter anpassar text-till-tal-systemet (TTS) automatiskt rätt känsla, så ingen ytterligare kontroll behövs.
Vad bör jag tänka på när jag använder stoppursfunktionen (paus)?
När du använder stoppursfunktionen motsvarar varje stoppur en paus på 0,5 sekunder, och du kan använda dem i följd för att skapa längre pauser, upp till maximalt 3 sekunder. Undvik dock att använda fler än två pauser i rad inom samma textsegment, eftersom detta kan göra att AI:n genererar oväntade ljud eller artefakter.