體驗全新「預覽語音」與「暫停」功能,影片創作更隨心所欲
Jan 11, 2025

高品質的影片內容,往往取決於細節——像是單字的發音、或戲劇性停頓的時機。VisionStory 隆重推出兩大新功能:預覽語音與暫停,讓你在正式產生影片前,擁有更高的精準度與彈性。
為什麼需要預覽語音?
預覽語音是所有希望確保文字轉語音(TTS)旁白效果完美的用戶必備利器。以往,你必須直接從輸入腳本到產生最終影片,雖然方便,但若發現小錯誤,已經消耗了寶貴的點數。現在有了預覽語音,你可以:
- 確認發音與語調
先聆聽整段由文字產生的語音,確保語氣、語調完全符合你的需求。 - 節省點數
在產生影片前發現語音錯誤,避免不必要的點數消耗。 - 避免串流產生的瑕疵
影片生成時,若語音同步採用即時串流,有些 AI 聲音在開頭或結尾可能出現音量不穩。先用預覽語音檢查,可有效避免這類問題,讓成品更專業。
常見注意事項: 雖然 TTS 技術已大幅進步,但某些複雜情境仍需特別留意:
- 專業術語或技術詞彙: 醫學、法律、科學等專有名詞,可能需要額外標點或拼音調整。
- 縮寫: 確認 TTS 是否正確展開或發音。
- 貨幣與數字: 語音可能以非預期格式讀出數字,或忽略貨幣符號。
- 大量標點: 句號、逗號、冒號等會影響語調與停頓。
發現問題時,只需修改文字,再次預覽語音,確認無誤後再點擊「產生口說影片」。
全新「暫停」功能介紹
有時你需要放慢語速,營造戲劇張力、強調重點,或精準處理難發音的詞彙。全新暫停功能——只要點擊「⏱ +0.5」圖示,即可在腳本任意位置插入短暫停頓。需要更長停頓時,只要連續插入多個暫停圖示即可。這項手動暫停功能可以:
- 提升清晰度:將長句拆分,讓聽眾更容易理解每個段落。
- 加強重點:在關鍵語句或笑點前營造期待感。
- 自訂 TTS 停頓:若 TTS 引擎未在你想要的位置停頓,或自動產生不必要的停頓,手動加入暫停可讓旁白更貼合你的需求。
重要使用小提醒
預覽語音採用字元數配額,依訂閱方案每月重置。一般來說,1 分鐘語音約為 1,000 字元:
- Pro 方案: 10,000 字元(約 10 分鐘語音)
- Advanced 方案: 50,000 字元(約 50 分鐘語音)
- Ultra 方案: 100,000 字元(約 100 分鐘語音)
暫停(碼錶)功能小技巧:
- 每個碼錶代表 0.5 秒停頓,可連續插入,最長可達 3 秒。
- 提醒: 單一文字段落內,請避免連續插入超過兩個暫停,否則 AI 可能產生異常聲音或雜音。
應用場景與實際效益
- 行銷與廣告
行銷人員常用簡短有力的語句搭配適時停頓,現在可隨時預覽不同語氣,優化品牌訊息,不浪費點數。 - 線上教學與知識影片
教育內容常有專業術語或縮寫,快速預覽發音、調整停頓,讓學習者更容易吸收。 - 故事敘述與旁白
戲劇性旁白講究節奏,精準停頓可營造懸疑或情感張力,TTS 自動節奏未必能完美呈現,手動調整更貼心。 - 專業簡報
財務報告或企業簡報時,名字或數字發音錯誤會影響專業形象。預覽與加入暫停,確保旁白流暢、專業。