Získejte větší kontrolu díky novým funkcím „Náhled audia“ a „Pauza“

Jan 11, 2025

Funkce náhledu audia a pauzy pro tvorbu video obsahu

Vytváření kvalitního video obsahu často závisí na těch nejmenších detailech – například na správné výslovnosti slova nebo načasování dramatické pauzy. S radostí představujeme dvě nové funkce – Náhled audia a Pauza – které vám umožní větší přesnost a flexibilitu ještě před samotným generováním videa.

Proč využívat Náhled audia?

Náhled audia je revoluční funkcí pro každého, kdo chce mít jistotu, že převod textu na řeč (TTS) zní přesně podle představ, ještě než utratí kredity za vytvoření videa. Dříve jste přecházeli rovnou od napsání scénáře k finálnímu videu. Tento postup byl sice rychlý, ale neumožňoval doladění detailů – a pokud jste objevili chybu, kredity už byly spotřebovány. S funkcí Náhled audia můžete:

  1. Ověřit výslovnost a tón
    Poslechněte si celou zvukovou stopu vygenerovanou z vašeho textu a ujistěte se, že odpovídá požadovanému stylu.
  2. Šetřit kredity
    Odhalením chyby v audionahrávce před samotným generováním videa předejdete zbytečnému čerpání kreditů.
  3. Vyhnout se artefaktům streamování
    Při generování audia v reálném čase pro synchronizaci s videem (tzv. „streaming pipeline“) se u některých AI hlasů mohou objevit drobné výkyvy hlasitosti na začátku a konci. Díky Náhledu audia se těmto artefaktům vyhnete a získáte profesionálnější výsledek.

Na co si dát pozor při psaní textu: Přestože technologie TTS výrazně pokročila, některé složitosti mohou stále představovat výzvu. Zaměřte se zejména na:

  • Odborné nebo technické termíny: Lékařská, právní či vědecká terminologie může vyžadovat úpravu interpunkce nebo pravopisu.
  • Zkratky: Ujistěte se, že TTS je správně rozpozná a přečte.
  • Měny a čísla: Vypravěč může čísla číst v nečekaném formátu nebo ignorovat symboly měn.
  • Silná interpunkce: Tečky, čárky a dvojtečky ovlivňují intonaci a tempo řeči.

Pokud narazíte na problém, jednoduše upravte text, spusťte Náhled audia znovu a ujistěte se, že je vše v pořádku, než kliknete na „Vygenerovat mluvící video“.

Představujeme funkci Pauza

Někdy potřebujete zpomalit tempo pro dramatický efekt, zdůraznit určitou frázi nebo přesně načasovat výslovnost složitých slov. Nová funkce Pauza – dostupná přes ikonu „⏱ +0,5“ – vám umožní vložit krátkou pauzu kamkoliv do scénáře. Pokud potřebujete delší pauzu, jednoduše vložte více ikon pauzy za sebou. Tato manuální pauza vám umožní:

  • Zvýšit srozumitelnost: Rozdělit dlouhé věty, aby posluchač lépe porozuměl každé části.
  • Podtrhnout důraz: Vybudovat napětí před klíčovým sdělením nebo vtipnou pointou.
  • Překonat výchozí pauzy TTS: Pokud engine TTS neudělá pauzu tam, kde chcete – nebo naopak přidá nechtěnou – manuální vložení pauzy zajistí, že výsledná narace bude přesně podle vašich představ.

Důležité tipy

Náhled audia využívá kvótu na základě počtu znaků, která se každý měsíc obnovuje podle vašeho tarifu. Obecně platí, že 1 minuta řeči odpovídá přibližně 1 000 znakům:

  • Pro: 10 000 znaků (~10 minut audia)
  • Advanced: 50 000 znaků (~50 minut audia)
  • Ultra: 100 000 znaků (~100 minut audia)

Tipy pro funkci Stopky:

  • Při použití funkce stopky představuje každá stopka pauzu o délce 0,5 sekundy. Můžete je použít za sebou pro delší pauzy, maximálně však do 3 sekund.
  • Poznámka: Vyhněte se použití více než dvou po sobě jdoucích pauz v jednom textovém segmentu, protože to může způsobit nečekané zvuky nebo artefakty v AI výstupu.

Praktické využití & přínosy

  • Marketing & reklama
    Marketeři rádi vzbuzují zvědavost krátkými, údernými větami – často následovanými dobře načasovanou pauzou. Nyní můžete doladit sdělení značky a vyzkoušet různé varianty bez zbytečné spotřeby kreditů.
  • E-learning & výuková videa
    Složitá terminologie či zkratky jsou v edukativním obsahu běžné. Rychle si ověřte jejich výslovnost, vložte správné pauzy a zajistěte, že studenti budou moci pohodlně sledovat výklad.
  • Vyprávění příběhů & narace
    Dramatické voiceovery stojí na přesném tempu. Dobře umístěná pauza může vyjádřit napětí nebo emoce – což automatické tempo TTS nemusí vždy vystihnout.
  • Profesionální prezentace
    Pokud potřebujete jasně prezentovat informace – například při finančních přehledech nebo firemních prezentacích – špatně vyslovená jména nebo čísla mohou snížit důvěryhodnost. Náhled a pauzy zajistí plynulý a profesionální hlasový doprovod.