體驗全新「預覽語音」與「暫停」功能,影片創作更隨心所欲

Jan 11, 2025

預覽語音與暫停功能,提升影片內容創作體驗

高品質的影片內容,往往取決於細節——像是單字的發音、或戲劇性停頓的時機。VisionStory 隆重推出兩大新功能:預覽語音暫停,讓你在正式產生影片前,擁有更高的精準度與彈性。

為什麼需要預覽語音?

預覽語音是所有希望確保文字轉語音(TTS)旁白效果完美的用戶必備利器。以往,你必須直接從輸入腳本到產生最終影片,雖然方便,但若發現小錯誤,已經消耗了寶貴的點數。現在有了預覽語音,你可以:

  1. 確認發音與語調
    先聆聽整段由文字產生的語音,確保語氣、語調完全符合你的需求。
  2. 節省點數
    在產生影片前發現語音錯誤,避免不必要的點數消耗。
  3. 避免串流產生的瑕疵
    影片生成時,若語音同步採用即時串流,有些 AI 聲音在開頭或結尾可能出現音量不穩。先用預覽語音檢查,可有效避免這類問題,讓成品更專業。

常見注意事項: 雖然 TTS 技術已大幅進步,但某些複雜情境仍需特別留意:

  • 專業術語或技術詞彙: 醫學、法律、科學等專有名詞,可能需要額外標點或拼音調整。
  • 縮寫: 確認 TTS 是否正確展開或發音。
  • 貨幣與數字: 語音可能以非預期格式讀出數字,或忽略貨幣符號。
  • 大量標點: 句號、逗號、冒號等會影響語調與停頓。

發現問題時,只需修改文字,再次預覽語音,確認無誤後再點擊「產生口說影片」。

全新「暫停」功能介紹

有時你需要放慢語速,營造戲劇張力、強調重點,或精準處理難發音的詞彙。全新暫停功能——只要點擊「⏱ +0.5」圖示,即可在腳本任意位置插入短暫停頓。需要更長停頓時,只要連續插入多個暫停圖示即可。這項手動暫停功能可以:

  • 提升清晰度:將長句拆分,讓聽眾更容易理解每個段落。
  • 加強重點:在關鍵語句或笑點前營造期待感。
  • 自訂 TTS 停頓:若 TTS 引擎未在你想要的位置停頓,或自動產生不必要的停頓,手動加入暫停可讓旁白更貼合你的需求。

重要使用小提醒

預覽語音採用字元數配額,依訂閱方案每月重置。一般來說,1 分鐘語音約為 1,000 字元

  • Pro 方案: 10,000 字元(約 10 分鐘語音)
  • Advanced 方案: 50,000 字元(約 50 分鐘語音)
  • Ultra 方案: 100,000 字元(約 100 分鐘語音)

暫停(碼錶)功能小技巧:

  • 每個碼錶代表 0.5 秒停頓,可連續插入,最長可達 3 秒。
  • 提醒: 單一文字段落內,請避免連續插入超過兩個暫停,否則 AI 可能產生異常聲音或雜音。

應用場景與實際效益

  • 行銷與廣告
    行銷人員常用簡短有力的語句搭配適時停頓,現在可隨時預覽不同語氣,優化品牌訊息,不浪費點數。
  • 線上教學與知識影片
    教育內容常有專業術語或縮寫,快速預覽發音、調整停頓,讓學習者更容易吸收。
  • 故事敘述與旁白
    戲劇性旁白講究節奏,精準停頓可營造懸疑或情感張力,TTS 自動節奏未必能完美呈現,手動調整更貼心。
  • 專業簡報
    財務報告或企業簡報時,名字或數字發音錯誤會影響專業形象。預覽與加入暫停,確保旁白流暢、專業。