体验全新“音频预览”和“停顿”功能,视频创作更随心所欲

Jan 11, 2025

音频预览与停顿功能,提升视频内容创作体验

高质量的视频内容,往往取决于细节——比如一个词的发音,或是恰到好处的停顿。我们很高兴为您带来两项全新功能:音频预览停顿,让您在生成完整视频前,拥有更高的精准度与灵活性。

为什么要用音频预览?

音频预览是提升视频旁白质量的利器,尤其适合希望在消耗积分前,确保文字转语音(TTS)效果完全符合预期的用户。以往,您只能直接从输入脚本到生成最终视频,虽然便捷,但难以细致调整,一旦发现小错误,积分也已消耗。现在,通过音频预览,您可以:

  1. 校验发音与语调
    听完整由文本生成的音频,确保风格和语气符合您的需求。
  2. 节省积分
    在生成视频前发现音频问题,避免不必要的积分消耗。
  3. 避免流式生成瑕疵
    部分AI语音在与视频同步的流式生成过程中,开头或结尾可能出现音量不均等小瑕疵。通过先预览音频,可有效规避这些问题,获得更专业的成品。

常见注意事项: 虽然TTS技术已非常先进,但某些复杂文本仍需留意:

  • 专业或技术术语: 医学、法律、科学等术语,可能需要额外标点或拼写调整。
  • 缩写: 确认TTS能正确展开或发音。
  • 货币与数字: 旁白可能以意外格式读出数字,或忽略货币符号。
  • 标点符号: 句号、逗号、冒号等会影响语音的语调与节奏。

如发现问题,只需修改文本,重新预览音频,确认无误后再点击“生成说话视频”。

全新停顿功能介绍

有时,您希望通过适当的停顿,营造戏剧效果、突出重点,或让难读的词语更清晰。全新停顿功能——通过“⏱ +0.5”图标插入——让您可在脚本任意位置添加短暂停顿。需要更长停顿时,只需连续插入多个停顿图标。手动停顿可:

  • 提升表达清晰度:将长句拆分,让听众更易理解每个片段。
  • 增强重点突出:在关键陈述或幽默点前制造悬念。
  • 自定义TTS停顿:如TTS未按预期停顿或出现多余停顿,手动添加停顿可让旁白完全按您的设想流畅呈现。

重要提示

音频预览采用字符配额,按订阅等级每月重置。一般来说,1分钟语音约为1,000字符

  • Pro: 10,000字符(约10分钟音频)
  • Advanced: 50,000字符(约50分钟音频)
  • Ultra: 100,000字符(约100分钟音频)

停顿(秒表)功能小贴士:

  • 每个秒表代表0.5秒停顿,可连续使用,最长可达3秒。
  • 温馨提醒: 单个文本片段中,避免连续插入超过两个停顿,否则AI可能产生异常声音或杂音。

应用场景与实际价值

  • 市场营销与广告
    营销人员常用简短有力的语句配合停顿吸引注意力。现在,您可反复预览不同表达方式,优化品牌信息,无需担心积分浪费。
  • 在线教育与教学视频
    教育内容中常有复杂术语或缩写。可快速预览发音,插入合适停顿,确保学习者轻松跟上节奏。
  • 故事讲述与旁白
    戏剧化旁白依赖精准节奏。恰到好处的停顿能传递悬念或情感,而TTS自动节奏未必总能做到这一点。
  • 专业演示与汇报
    财务报告或商务演讲中,名字或数字发音错误会影响专业形象。通过预览和添加停顿,确保旁白流畅、专业。