体验全新“音频预览”和“停顿”功能,视频创作更可控
Jan 11, 2025

高质量的视频内容,往往取决于细节——比如一个词的发音,或是恰到好处的停顿。我们很高兴为您带来两项全新功能:音频预览和停顿,让您在生成完整视频前,拥有更高的精准度与灵活性。
为什么要用音频预览?
音频预览是文本转语音(TTS)用户的福音,让您在消耗积分生成视频前,先确保旁白效果完全符合预期。以往,您只能直接从输入脚本到生成最终视频,虽然方便,但难以细致调整——一旦发现小错误,积分已被消耗。而有了音频预览,您可以:
- 校验发音与语调
听完整的文本音频,确保风格、语气与您的需求一致。 - 节省积分
在生成视频前发现并修正音频问题,避免不必要的积分浪费。 - 避免流式生成瑕疵
部分AI语音在流式生成(与视频同步)时,开头或结尾可能出现音量不均等问题。通过先预览音频,可有效规避这些瑕疵,获得更专业的成品。
常见注意事项: 虽然TTS技术已非常先进,但某些复杂文本仍需留意:
- 专业术语或技术词汇: 医学、法律、科学等领域词汇,可能需要额外标点或拼写调整。
- 缩写: 确认TTS能正确朗读或扩展缩写。
- 货币与数字: 旁白可能以意外的格式读出数字,或忽略货币符号。
- 标点符号: 句号、逗号、冒号等会影响语调与节奏。
如发现问题,只需修改文本,重新预览音频,确认无误后再点击“生成说话视频”。
全新停顿功能介绍
有时,您希望通过慢节奏营造氛围、强调某句话,或精准处理难读词汇。全新停顿功能——通过“⏱ +0.5”图标插入——可在脚本任意位置添加短暂停顿。需要更长停顿时,只需连续插入多个停顿图标。该功能可:
- 提升表达清晰度:分割长句,让听众更易理解每个信息点。
- 增强重点与情感:在关键语句或笑点前制造悬念与期待。
- 自定义TTS停顿:如TTS默认停顿不符合需求,或出现多余停顿,手动添加停顿可让旁白完全按您的设想流畅呈现。
重要提示
音频预览按字符数计入配额,每月根据订阅等级重置。一般来说,1分钟语音约为1,000字符:
- Pro: 10,000字符(约10分钟音频)
- Advanced: 50,000字符(约50分钟音频)
- Ultra: 100,000字符(约100分钟音频)
停表(停顿)功能小贴士:
- 每个停表图标代表0.5秒停顿,可连续插入,最长可达3秒。
- 提醒: 单个文本片段内请勿连续插入超过2个停顿,否则AI可能产生异常声音或杂音。
应用场景与实际价值
- 营销与广告
营销人员常用简短有力的语句配合停顿吸引注意力。现在,您可反复预览不同表达方式,优化品牌信息,无需担心积分浪费。 - 在线教育与教学视频
教育内容中常有复杂术语或缩写。可快速预览发音,插入合适停顿,确保学习者轻松跟上节奏。 - 故事讲述与旁白
剧情配音对节奏要求极高。恰到好处的停顿能传递悬念与情感,而TTS自动节奏未必总能满足需求。 - 专业演示与汇报
财务报告、企业路演等场合,名字或数字读错会影响专业形象。通过预览与停顿,确保旁白流畅、专业。