體驗全新「預覽音頻」及「暫停」功能,影片創作更自主

Jan 12, 2025

預覽音頻及暫停功能,提升影片內容創作體驗

高質素的影片內容,往往取決於細節——例如字詞的發音、戲劇性的停頓時機。VisionStory 現已推出兩項全新功能:預覽音頻暫停,讓你在正式生成影片前,擁有更高的精確度與彈性。

為何要用預覽音頻?

預覽音頻對於希望確保文字轉語音(TTS)旁白效果完美的用戶來說,是一項革命性功能。以往你只能直接輸入稿件並生成影片,雖然方便,但難以細緻調整;若發現小錯誤,已經消耗了寶貴的點數。有了預覽音頻,你可以:

  1. 檢查發音及語調
    先聆聽整段由文字生成的音頻,確保語音風格及語調符合你的預期。
  2. 節省點數
    在生成影片前發現並修正錯誤,避免不必要的點數消耗。
  3. 避免串流瑕疵
    影片生成時即時串流語音,有機會出現開頭或結尾音量不穩等問題。預先用預覽音頻檢查,可有效避免這些瑕疵,令最終影片更專業。

常見注意事項: 雖然 TTS 技術已非常成熟,但某些情況仍需特別留意:

  • 專業或技術詞彙: 醫學、法律、科學等術語,可能需要額外標點或拼音調整。
  • 縮寫: 確保 TTS 能正確讀出或解釋縮寫。
  • 貨幣及數字: 語音旁白有時會以非預期方式讀出數字或忽略貨幣符號。
  • 標點符號: 句號、逗號、冒號等會影響語調及節奏。

如發現問題,只需修改文字,再次預覽音頻,確認無誤後再點擊「生成說話影片」。

全新暫停功能介紹

有時你想加強戲劇效果、突出重點,或精確處理難讀字詞。全新暫停功能——只需點擊「⏱ +0.5」圖示,即可在稿件任何位置插入短暫停頓。如需更長停頓,可連續插入多個暫停。這個手動暫停功能可以:

  • 提升清晰度: 將長句分段,令聽眾更易理解內容。
  • 加強重點: 在重要語句或笑點前加入停頓,營造期待感。
  • 自訂停頓節奏: 如 TTS 系統未能在理想位置停頓,或自動加入不必要的停頓,你可手動調整,確保旁白節奏完全符合你的構思。

重要貼士

預覽音頻採用字元配額,會根據你的訂閱方案每月重設。一般來說,1 分鐘語音約為 1,000 字元

  • 免費用戶: 500 字元(約 0.5 分鐘音頻)
  • Lite: 1,000 字元(約 1 分鐘音頻)
  • Pro: 10,000 字元(約 10 分鐘音頻)
  • Advanced: 50,000 字元(約 50 分鐘音頻)
  • Ultra: 100,000 字元(約 100 分鐘音頻)

使用暫停(秒錶)功能貼士:

  • 每個秒錶代表 0.5 秒停頓,可連續使用,最長可達 3 秒。
  • 注意: 建議每段文字內不要連續插入超過兩個暫停,否則 AI 可能會產生異常聲音或雜音。

應用場景及實際效益

  • 市場推廣及廣告
    市場人員常用簡短有力的語句配合停頓吸引注意。現在你可隨時預覽不同語氣,優化品牌訊息,無需擔心浪費點數。
  • 網上教學及教學影片
    教育內容常有複雜術語或縮寫。你可快速預覽發音、加入適當停頓,確保學習者易於跟上內容。
  • 故事講述及旁白
    戲劇性旁白講求節奏感。恰到好處的停頓能營造懸念或情感層次,TTS 自動節奏未必能完全掌握,手動調整更貼合需求。
  • 專業簡報
    財務報告或商業簡報時,名字或數字讀錯會影響專業形象。預覽及加入停頓,確保旁白流暢專業。