体验全新“音频预览”和“停顿”功能,视频创作更可控

Jan 11, 2025

音频预览与停顿功能,提升视频内容创作体验

高质量的视频内容,往往取决于细节——比如一个词的发音,或是恰到好处的停顿。我们很高兴为您带来两项全新功能:音频预览停顿,让您在生成完整视频前,拥有更高的精准度与灵活性。

为什么要用音频预览?

音频预览是文本转语音(TTS)用户的福音,让您在消耗积分生成视频前,先确保旁白效果完全符合预期。以往,您只能直接从输入脚本到生成最终视频,虽然方便,但难以细致调整——一旦发现小错误,积分已被消耗。而有了音频预览,您可以:

  1. 校验发音与语调
    听完整的文本音频,确保风格、语气与您的需求一致。
  2. 节省积分
    在生成视频前发现并修正音频问题,避免不必要的积分浪费。
  3. 避免流式生成瑕疵
    部分AI语音在流式生成(与视频同步)时,开头或结尾可能出现音量不均等问题。通过先预览音频,可有效规避这些瑕疵,获得更专业的成品。

常见注意事项: 虽然TTS技术已非常先进,但某些复杂文本仍需留意:

  • 专业术语或技术词汇: 医学、法律、科学等领域词汇,可能需要额外标点或拼写调整。
  • 缩写: 确认TTS能正确朗读或扩展缩写。
  • 货币与数字: 旁白可能以意外的格式读出数字,或忽略货币符号。
  • 标点符号: 句号、逗号、冒号等会影响语调与节奏。

如发现问题,只需修改文本,重新预览音频,确认无误后再点击“生成说话视频”。

全新停顿功能介绍

有时,您希望通过慢节奏营造氛围、强调某句话,或精准处理难读词汇。全新停顿功能——通过“⏱ +0.5”图标插入——可在脚本任意位置添加短暂停顿。需要更长停顿时,只需连续插入多个停顿图标。该功能可:

  • 提升表达清晰度:分割长句,让听众更易理解每个信息点。
  • 增强重点与情感:在关键语句或笑点前制造悬念与期待。
  • 自定义TTS停顿:如TTS默认停顿不符合需求,或出现多余停顿,手动添加停顿可让旁白完全按您的设想流畅呈现。

重要提示

音频预览按字符数计入配额,每月根据订阅等级重置。一般来说,1分钟语音约为1,000字符

  • Pro: 10,000字符(约10分钟音频)
  • Advanced: 50,000字符(约50分钟音频)
  • Ultra: 100,000字符(约100分钟音频)

停表(停顿)功能小贴士:

  • 每个停表图标代表0.5秒停顿,可连续插入,最长可达3秒。
  • 提醒: 单个文本片段内请勿连续插入超过2个停顿,否则AI可能产生异常声音或杂音。

应用场景与实际价值

  • 营销与广告
    营销人员常用简短有力的语句配合停顿吸引注意力。现在,您可反复预览不同表达方式,优化品牌信息,无需担心积分浪费。
  • 在线教育与教学视频
    教育内容中常有复杂术语或缩写。可快速预览发音,插入合适停顿,确保学习者轻松跟上节奏。
  • 故事讲述与旁白
    剧情配音对节奏要求极高。恰到好处的停顿能传递悬念与情感,而TTS自动节奏未必总能满足需求。
  • 专业演示与汇报
    财务报告、企业路演等场合,名字或数字读错会影响专业形象。通过预览与停顿,确保旁白流畅、专业。