體驗全新「預覽語音」及「暫停」功能,影片製作更自主
Jan 11, 2025

高質素的影片內容,往往取決於細微之處——例如字詞的發音、或戲劇性停頓的時機。VisionStory 隆重推出兩大新功能:預覽語音及暫停,讓你在正式生成影片前,擁有更高的精準度與彈性。
為何要用預覽語音?
預覽語音對於希望確保文字轉語音(TTS)效果完美的用戶來說,是一項革命性功能。以往你只能直接輸入腳本並生成影片,雖然方便,但難以細緻調整——即使發現小錯誤,已經消耗了寶貴點數。有了預覽語音,你可以:
- 檢查發音及語調
先聆聽整段由文字生成的語音,確保語氣、語速及風格符合預期。 - 節省點數
在生成影片前發現語音問題,避免不必要的點數消耗。 - 避免串流瑕疵
影片生成時即時串流語音,有機會出現開頭或結尾音量不穩等問題。預先用預覽語音檢查,可有效避免這些瑕疵,令最終影片更專業。
常見陷阱及文字注意事項: 雖然 TTS 技術已大幅進步,但某些情況仍需留意:
- 專業或技術詞彙: 醫學、法律、科學等術語,可能需要額外標點或拼寫調整。
- 縮寫: 確保 TTS 能正確讀出或解釋縮寫。
- 貨幣及數字: 語音可能以非預期方式讀出數字或忽略貨幣符號。
- 標點符號: 句號、逗號、冒號等會影響語調及停頓。
如發現問題,只需修改文字,再次預覽語音,確認無誤後再生成說話影片。
全新暫停功能介紹
有時你想加強戲劇效果、突出重點,或精確處理難讀字詞。全新暫停功能——只需點擊「⏱ +0.5」圖示,即可在腳本任何位置插入短暫停頓。需要更長停頓,只需連續加入多個暫停圖示。這個手動暫停功能可以:
- 提升清晰度: 將長句分段,令聽眾更易理解內容。
- 加強重點: 在關鍵語句或笑點前加入停頓,營造期待感。
- 自訂停頓位置: 如 TTS 系統未能在理想位置停頓,或出現多餘停頓,手動加入暫停,確保語音流暢自然。
重要貼士
預覽語音採用字元配額,按訂閱計劃每月重設。一般來說,1 分鐘語音約為 1,000 字元:
- Pro 計劃: 10,000 字元(約 10 分鐘語音)
- Advanced 計劃: 50,000 字元(約 50 分鐘語音)
- Ultra 計劃: 100,000 字元(約 100 分鐘語音)
使用暫停(秒錶)功能小貼士:
- 每個秒錶代表 0.5 秒停頓,可連續使用,最長可達 3 秒。
- 注意: 單一文字段落內,避免連續使用超過兩個暫停,否則 AI 可能產生異常聲音或雜音。
應用場景及實際效益
- 市場推廣及廣告
市場人員常用簡短有力的句子配合停頓吸引注意。現在你可預覽不同語音效果,優化品牌訊息,節省點數。 - 網上教學及教學影片
教育內容常有複雜術語或縮寫。可快速預覽發音、加入合適停頓,確保學習者易於跟上。 - 故事講述及旁白
戲劇性旁白講求節奏感。適時停頓可營造懸念或情感層次,TTS 自動節奏未必能完全掌握,手動調整更貼近理想效果。 - 專業簡報
財務報告或商業簡報時,名字或數字讀錯會影響專業形象。預覽及加入停頓,確保語音流暢專業。