体验全新“音频预览”和“停顿”功能,视频创作更随心所欲
Jan 11, 2025

高质量的视频内容,往往取决于细节——比如一个词的发音,或是恰到好处的停顿。我们很高兴为您带来两项全新功能:音频预览和停顿,让您在生成完整视频前,拥有更高的精准度与灵活性。
为什么要用音频预览?
音频预览是提升视频旁白质量的利器,尤其适合希望在消耗积分前,确保文字转语音(TTS)效果完全符合预期的用户。以往,您只能直接从输入脚本到生成最终视频,虽然便捷,但难以细致调整,一旦发现小错误,积分也已消耗。现在,通过音频预览,您可以:
- 校验发音与语调
听完整由文本生成的音频,确保风格和语气符合您的需求。 - 节省积分
在生成视频前发现音频问题,避免不必要的积分消耗。 - 避免流式生成瑕疵
部分AI语音在与视频同步的流式生成过程中,开头或结尾可能出现音量不均等小瑕疵。通过先预览音频,可有效规避这些问题,获得更专业的成品。
常见注意事项: 虽然TTS技术已非常先进,但某些复杂文本仍需留意:
- 专业或技术术语: 医学、法律、科学等术语,可能需要额外标点或拼写调整。
- 缩写: 确认TTS能正确展开或发音。
- 货币与数字: 旁白可能以意外格式读出数字,或忽略货币符号。
- 标点符号: 句号、逗号、冒号等会影响语音的语调与节奏。
如发现问题,只需修改文本,重新预览音频,确认无误后再点击“生成说话视频”。
全新停顿功能介绍
有时,您希望通过适当的停顿,营造戏剧效果、突出重点,或让难读的词语更清晰。全新停顿功能——通过“⏱ +0.5”图标插入——让您可在脚本任意位置添加短暂停顿。需要更长停顿时,只需连续插入多个停顿图标。手动停顿可:
- 提升表达清晰度:将长句拆分,让听众更易理解每个片段。
- 增强重点突出:在关键陈述或幽默点前制造悬念。
- 自定义TTS停顿:如TTS未按预期停顿或出现多余停顿,手动添加停顿可让旁白完全按您的设想流畅呈现。
重要提示
音频预览采用字符配额,按订阅等级每月重置。一般来说,1分钟语音约为1,000字符:
- Pro: 10,000字符(约10分钟音频)
- Advanced: 50,000字符(约50分钟音频)
- Ultra: 100,000字符(约100分钟音频)
停顿(秒表)功能小贴士:
- 每个秒表代表0.5秒停顿,可连续使用,最长可达3秒。
- 温馨提醒: 单个文本片段中,避免连续插入超过两个停顿,否则AI可能产生异常声音或杂音。
应用场景与实际价值
- 市场营销与广告
营销人员常用简短有力的语句配合停顿吸引注意力。现在,您可反复预览不同表达方式,优化品牌信息,无需担心积分浪费。 - 在线教育与教学视频
教育内容中常有复杂术语或缩写。可快速预览发音,插入合适停顿,确保学习者轻松跟上节奏。 - 故事讲述与旁白
戏剧化旁白依赖精准节奏。恰到好处的停顿能传递悬念或情感,而TTS自动节奏未必总能做到这一点。 - 专业演示与汇报
财务报告或商务演讲中,名字或数字发音错误会影响专业形象。通过预览和添加停顿,确保旁白流畅、专业。