体验全新“预览音频”和“暂停”功能,掌控视频创作每一刻
Jan 12, 2025

高质量的视频内容往往取决于细节——比如单词的发音,或戏剧性的停顿时机。我们很高兴为您带来两项全新功能——预览音频和暂停,让您在正式生成完整视频前,拥有更高的精准度与灵活性。
为什么要用预览音频?
预览音频是提升文字转语音(TTS)旁白准确性的利器,让您在消耗积分生成视频前,先确保语音效果完全符合预期。以往,您只能直接从输入脚本到生成最终视频,虽然流程便捷,但难以细致调整——一旦发现小错误,积分已被消耗。现在,通过预览音频,您可以:
- 校验发音与语调
听完整的文本生成音频,确保风格与您的需求一致。 - 节省积分
在生成视频前发现并修正音频问题,避免不必要的积分消耗。 - 避免流式生成瑕疵
部分AI语音在与视频同步的流式生成中,开头或结尾可能出现音量不均。先用预览音频检查,可有效规避这些问题,提升最终成品质量。
常见注意事项与文本建议: 虽然TTS技术已大幅进步,但某些复杂情况仍需留意:
- 专业或技术术语: 医学、法律、科学等术语,可能需额外标点或拼写调整。
- 缩写: 确认TTS能正确朗读或扩展缩写。
- 货币与数字: 旁白可能以意外格式读出数字,或忽略货币符号。
- 大量标点: 句号、逗号、冒号等会影响语调与节奏。
如发现问题,只需修改文本,重新预览音频,确认无误后再点击“生成说话视频”。
全新暂停功能介绍
有时,您希望通过适当的停顿,增强戏剧效果、突出重点,或精准处理难读词汇。全新暂停功能——通过“⏱ +0.5”图标插入——让您在脚本任意位置添加短暂停顿。需要更长停顿时,只需连续插入多个暂停图标。手动暂停可:
- 提升清晰度:分割长句,让听众更易理解每个片段。
- 增强强调:在关键陈述或幽默点前制造期待。
- 自定义TTS停顿:如TTS未按预期停顿或出现多余停顿,手动添加暂停可确保旁白流畅自然,完全符合您的设想。
重要提示
预览音频按字符配额计费,每月根据您的订阅等级重置。一般来说,1分钟语音约为1,000字符:
- 免费: 500字符(约0.5分钟音频)
- Lite: 1,000字符(约1分钟音频)
- Pro: 10,000字符(约10分钟音频)
- Advanced: 50,000字符(约50分钟音频)
- Ultra: 100,000字符(约100分钟音频)
秒表(暂停)功能小贴士:
- 每个秒表代表0.5秒停顿,可连续插入,最长可达3秒。
- 温馨提醒: 单个文本片段内请勿连续插入超过两个暂停,否则AI可能产生异常声音或杂音。
应用场景与实际价值
- 市场营销与广告
营销人员喜欢用简短有力的句子加上恰到好处的停顿吸引注意力。现在,您可以反复预览不同表达方式,无需浪费积分,轻松打磨品牌信息。 - 在线教育与教学视频
教育内容常涉及复杂术语或缩写。可快速预览发音,插入合适停顿,确保学习者轻松跟上节奏。 - 故事讲述与旁白
戏剧性配音依赖精准节奏。恰到好处的停顿能传递悬念或情感,而TTS自动节奏未必总能做到这一点。 - 专业演示与汇报
财务报告或企业演讲中,名字或数字发音错误会影响专业形象。预览并添加停顿,确保语音流畅、专业。