Audio i głos

Jakie języki obsługujecie?
Obsługujemy ponad 30 najważniejszych języków na świecie, w tym m.in.: angielski, chiński, hiszpański, arabski, portugalski, rosyjski, japoński, pendżabski, niemiecki, francuski, koreański, turecki, tamilski, wietnamski, hindi, bengalski, urdu, perski, włoski, indonezyjski, tajski, marathi, telugu, ukraiński, malajski, rumuński, polski, niderlandzki, gudżarati i kannada.
Ile głosów jest dostępnych w bibliotece głosów VisionStory i czy mogę je dostosować?
VisionStory oferuje ponad 200 głosów w swojej bibliotece, które można filtrować według płci, wieku i zastosowania. Jeśli nie znajdziesz odpowiedniego głosu, możesz również stworzyć własny klon głosu AI, przesyłając lub nagrywając własne nagranie audio.
Dlaczego w moim języku dostępnych jest mniej opcji głosowych?
Ograniczona liczba głosów w niektórych językach wynika z tego, że są one specjalnie dostosowane do tych języków. Jednak dzięki szerokiemu wsparciu językowemu, głosy dostępne np. w języku angielskim mogą mówić także w innych językach, co daje większą elastyczność w wyborze głosu.
Czym jest klonowanie głosu i jak mogę sklonować głos?
Klonowanie głosu pozwala stworzyć spersonalizowany głos AI, który naśladuje wybrany głos poprzez przesłanie lub nagranie próbki dźwiękowej. Aby sklonować głos, upewnij się, że nagranie jest wyraźne i wykonane w cichym otoczeniu, aby uzyskać najlepsze rezultaty.
Czy klonowanie głosu jest darmowe?
Klonowanie głosu jest darmowe i pozwala sprawdzić, czy sklonowany głos przypomina Twój. Jednak aby użyć sklonowanego głosu do generowania wideo, musisz wykupić co najmniej plan Pro lub wyższy.
Ile języków jest obsługiwanych w funkcji klonowania głosu?
Klonowanie głosu jest bezpłatnie dostępne w ponad 32 językach. Lista obsługiwanych języków może się zmieniać, dlatego zawsze sprawdź aktualne opcje w funkcji klonowania głosu. Uwaga: choć klonowanie jest darmowe, do wykorzystania sklonowanego głosu w wideo wymagana jest subskrypcja.
Czym jest podgląd audio i jakie są jego zalety?
Podgląd audio pozwala wygenerować mowę do Twojego mówiącego wideo przed ostatecznym utworzeniem filmu. Funkcja ta umożliwia sprawdzenie głosu, wymowy oraz pauz, aby upewnić się, że spełniają Twoje oczekiwania. Możesz wprowadzać poprawki do głosu przed wygenerowaniem wideo. Dla wszystkich subskrybentów funkcja ta jest bezpłatna, a limit podglądów odnawia się codziennie. Jeśli osiągniesz dzienny limit podglądów, możesz dokupić dodatkowy limit za pomocą kredytów.
Co oznacza ikona stopera i +0,5s?
Ikona stopera i funkcja +0,5s pozwalają wstawić 0,5-sekundową pauzę w generowanym głosie. Możesz dodać kilka ikon stopera pod rząd, aby uzyskać dłuższe przerwy w swoim wideo.
Czym jest import URL i jakie adresy URL są obsługiwane?
Import URL umożliwia pobranie i wyodrębnienie dźwięku z podanego linku, aby wykorzystać go do generowania wideo. Obecnie obsługiwane są linki z YouTube i TikTok. Jeśli chcesz, aby obsługiwane były inne serwisy, skontaktuj się z nami. Dodatkowo możesz skorzystać z funkcji zmiany głosu, aby zmodyfikować zaimportowane nagranie, zachowując oryginalną treść.
Czym jest funkcja usuwania szumów?
Funkcja usuwania szumów pomaga wyeliminować dźwięki tła z nagranego lub importowanego audio, zapewniając wyraźniejszą jakość dźwięku w Twoich filmach. Funkcja ta jest dostępna dla użytkowników posiadających co najmniej plan Pro.
Czym jest funkcja zmiany głosu?
Funkcja zmiany głosu pozwala modyfikować głos w nagraniu, dzięki czemu możesz tworzyć unikalne wersje audio przy zachowaniu oryginalnej treści. Funkcja ta jest dostępna dla użytkowników posiadających co najmniej plan Pro.
Czy mogę kontrolować emocje w głosie?
Emocje w głosie są przekazywane poprzez tekst, który wpisujesz. Gdy używasz różnych tekstów, system tekst-na-mowę (TTS) automatycznie nadaje odpowiednie emocje, więc nie jest potrzebna dodatkowa kontrola.
O czym należy pamiętać, korzystając z funkcji stopera (pauzy)?
Każdy stoper oznacza pauzę trwającą 0,5 sekundy i można je stosować kolejno, aby uzyskać dłuższe przerwy – maksymalnie do 3 sekund. Należy jednak unikać używania więcej niż dwóch kolejnych pauz w jednym fragmencie tekstu, ponieważ może to spowodować, że AI wygeneruje nieoczekiwane dźwięki lub artefakty.