體驗全新「預覽音頻」及「暫停」功能,影片創作更自主
Jan 12, 2025

高質素的影片內容,往往取決於細節——例如字詞的發音、戲劇性的停頓時機。VisionStory 現已推出兩項全新功能:預覽音頻及暫停,讓你在正式生成影片前,擁有更高的精確度與彈性。
為何要用預覽音頻?
預覽音頻對於希望確保文字轉語音(TTS)旁白效果完美的用戶來說,是一項革命性功能。以往你只能直接輸入稿件並生成影片,雖然方便,但難以細緻調整;若發現小錯誤,已經消耗了寶貴的點數。有了預覽音頻,你可以:
- 檢查發音及語調
先聆聽整段由文字生成的音頻,確保語音風格及語調符合你的預期。 - 節省點數
在生成影片前發現並修正錯誤,避免不必要的點數消耗。 - 避免串流瑕疵
影片生成時即時串流語音,有機會出現開頭或結尾音量不穩等問題。預先用預覽音頻檢查,可有效避免這些瑕疵,令最終影片更專業。
常見注意事項: 雖然 TTS 技術已非常成熟,但某些情況仍需特別留意:
- 專業或技術詞彙: 醫學、法律、科學等術語,可能需要額外標點或拼音調整。
- 縮寫: 確保 TTS 能正確讀出或解釋縮寫。
- 貨幣及數字: 語音旁白有時會以非預期方式讀出數字或忽略貨幣符號。
- 標點符號: 句號、逗號、冒號等會影響語調及節奏。
如發現問題,只需修改文字,再次預覽音頻,確認無誤後再點擊「生成說話影片」。
全新暫停功能介紹
有時你想加強戲劇效果、突出重點,或精確處理難讀字詞。全新暫停功能——只需點擊「⏱ +0.5」圖示,即可在稿件任何位置插入短暫停頓。如需更長停頓,可連續插入多個暫停。這個手動暫停功能可以:
- 提升清晰度: 將長句分段,令聽眾更易理解內容。
- 加強重點: 在重要語句或笑點前加入停頓,營造期待感。
- 自訂停頓節奏: 如 TTS 系統未能在理想位置停頓,或自動加入不必要的停頓,你可手動調整,確保旁白節奏完全符合你的構思。
重要貼士
預覽音頻採用字元配額,會根據你的訂閱方案每月重設。一般來說,1 分鐘語音約為 1,000 字元:
- 免費用戶: 500 字元(約 0.5 分鐘音頻)
- Lite: 1,000 字元(約 1 分鐘音頻)
- Pro: 10,000 字元(約 10 分鐘音頻)
- Advanced: 50,000 字元(約 50 分鐘音頻)
- Ultra: 100,000 字元(約 100 分鐘音頻)
使用暫停(秒錶)功能貼士:
- 每個秒錶代表 0.5 秒停頓,可連續使用,最長可達 3 秒。
- 注意: 建議每段文字內不要連續插入超過兩個暫停,否則 AI 可能會產生異常聲音或雜音。
應用場景及實際效益
- 市場推廣及廣告
市場人員常用簡短有力的語句配合停頓吸引注意。現在你可隨時預覽不同語氣,優化品牌訊息,無需擔心浪費點數。 - 網上教學及教學影片
教育內容常有複雜術語或縮寫。你可快速預覽發音、加入適當停頓,確保學習者易於跟上內容。 - 故事講述及旁白
戲劇性旁白講求節奏感。恰到好處的停頓能營造懸念或情感層次,TTS 自動節奏未必能完全掌握,手動調整更貼合需求。 - 專業簡報
財務報告或商業簡報時,名字或數字讀錯會影響專業形象。預覽及加入停頓,確保旁白流暢專業。