Obsługujemy ponad 30 najważniejszych języków na świecie, w tym m.in.: angielski, chiński, hiszpański, arabski, portugalski, rosyjski, japoński, pendżabski, niemiecki, francuski, koreański, turecki, tamilski, wietnamski, hindi, bengalski, urdu, perski, włoski, indonezyjski, tajski, marathi, telugu, ukraiński, malajski, rumuński, polski, niderlandzki, gudżarati i kannada.
Ile głosów jest dostępnych w bibliotece głosów VisionStory i czy mogę je dostosować?
VisionStory oferuje ponad 200 głosów w swojej bibliotece, które można filtrować według płci, wieku i zastosowania. Jeśli nie znajdziesz odpowiedniego głosu, możesz również stworzyć własny klon głosu AI, przesyłając lub nagrywając własne nagranie audio.
Dlaczego w moim języku dostępnych jest mniej opcji głosowych?
Ograniczona liczba głosów w niektórych językach wynika z tego, że są one specjalnie dostosowane do tych języków. Jednak dzięki szerokiemu wsparciu językowemu, głosy dostępne np. w języku angielskim mogą mówić także w innych językach, co daje większą elastyczność w wyborze głosu.
Czym jest klonowanie głosu i jak mogę sklonować głos?
Klonowanie głosu pozwala stworzyć spersonalizowany głos AI, który naśladuje wybrany głos poprzez przesłanie lub nagranie próbki dźwiękowej. Aby sklonować głos, upewnij się, że nagranie jest wyraźne i wykonane w cichym otoczeniu, aby uzyskać najlepsze rezultaty.
Czy klonowanie głosu jest darmowe?
Klonowanie głosu jest darmowe dla języka angielskiego, hiszpańskiego, japońskiego i chińskiego, co pozwala sprawdzić, czy sklonowany głos przypomina Twój. Jednak aby użyć sklonowanego głosu do generowania wideo, musisz mieć wykupiony co najmniej Pro Plan. Klonowanie głosu w innych językach również wymaga subskrypcji Pro Plan lub wyższej.
Ile języków jest obsługiwanych w funkcji klonowania głosu?
Klonowanie głosu jest bezpłatnie dostępne w czterech językach: angielskim, hiszpańskim, japońskim i chińskim. Dodatkowe języki są dostępne, ale wymagają subskrypcji Pro Plan lub wyższej. Lista obsługiwanych języków może się zmieniać, dlatego zalecamy sprawdzenie aktualnych opcji w funkcji klonowania głosu.
Czym jest podgląd audio i jakie są jego zalety?
Podgląd audio pozwala wygenerować mowę do Twojego mówiącego wideo przed ostatecznym utworzeniem filmu. Funkcja ta umożliwia sprawdzenie głosu, wymowy i pauz, aby upewnić się, że spełniają Twoje oczekiwania. Możesz wprowadzać poprawki do głosu przed wygenerowaniem wideo, co pozwala zaoszczędzić kredyty. Funkcja ta jest dostępna od planu Pro i wyższych, a różne plany oferują różne limity podglądu audio.
Co oznacza ikona stopera i +0,5s?
Ikona stopera i funkcja +0,5s pozwalają wstawić 0,5-sekundową pauzę w generowanym głosie. Możesz dodać kilka ikon stopera pod rząd, aby uzyskać dłuższe przerwy w swoim wideo.
Czym jest import URL i jakie adresy URL są obsługiwane?
Import URL umożliwia pobranie i wyodrębnienie dźwięku z podanego linku, aby wykorzystać go do generowania wideo. Obecnie obsługiwane są linki z YouTube i TikTok. Jeśli chcesz, aby obsługiwane były inne serwisy, skontaktuj się z nami. Dodatkowo możesz skorzystać z funkcji zmiany głosu, aby zmodyfikować zaimportowane nagranie, zachowując oryginalną treść.
Czym jest funkcja usuwania szumów?
Funkcja usuwania szumów pomaga wyeliminować dźwięki tła z nagranego lub importowanego audio, zapewniając wyraźniejszą jakość dźwięku w Twoich filmach. Funkcja ta jest dostępna dla użytkowników posiadających co najmniej plan Pro.
Czym jest funkcja zmiany głosu?
Funkcja zmiany głosu pozwala modyfikować głos w nagraniu, dzięki czemu możesz tworzyć unikalne wersje audio przy zachowaniu oryginalnej treści. Funkcja ta jest dostępna dla użytkowników posiadających co najmniej plan Pro.
Czy mogę kontrolować emocje w głosie?
Emocje w głosie są przekazywane poprzez tekst, który wpisujesz. Gdy używasz różnych tekstów, system tekst-na-mowę (TTS) automatycznie nadaje odpowiednie emocje, więc nie jest potrzebna dodatkowa kontrola.
O czym należy pamiętać, korzystając z funkcji stopera (pauzy)?
Każdy stoper oznacza pauzę trwającą 0,5 sekundy i można je stosować kolejno, aby uzyskać dłuższe przerwy – maksymalnie do 3 sekund. Należy jednak unikać używania więcej niż dwóch kolejnych pauz w jednym fragmencie tekstu, ponieważ może to spowodować, że AI wygeneruje nieoczekiwane dźwięki lub artefakty.