如何使用 VisionStory 创建说话视频

Dec 15, 2024

说话视频制作流程示意图

1. 上传或选择角色

上传一张正面照片,确保肩膀清晰可见,以获得更自然的嘴型和面部跟踪效果。如果你已经上传过图片,或想尝试 VisionStory 的样例库,也可以从已有角色中选择

上传角色图片用于视频制作

2. 添加台词或音频

接下来,决定你的角色要说什么或表达什么内容:

  • 输入文本:直接在文本框中输入你想让角色说的话。
  • 导入/录制音频:上传预先录制的音频文件,或现场录制新音频。
  • URL 导入:粘贴链接(如 YouTube 或 TikTok),将外部音频导入视频中。

3. 选择或克隆语音

设置好台词或音频后,选择最适合的语音:

  • 选择 200+ 种 AI 语音:进入语音库,可按语言、性别、年龄和风格筛选。点击播放图标可试听每种语音。
  • 克隆语音需 Pro 及以上套餐):如需自定义语音,可上传或录制样本音频,VisionStory 会为你生成 AI 语音克隆,可在多个项目中使用。
为角色选择或克隆语音

4. 配置视频设置

在生成视频前,可根据需求调整画面和输出参数:

  • 画质
    • 标准(无需额外积分)
    • 高清 HD(Pro 及以上套餐,需额外积分)
  • 画面比例:9:16(竖屏)、16:9(横屏)、1:1(正方形),适配不同平台。
  • 面部表情:通过“情感”选择器调整角色表情(如愉快、营销、新闻等),仅影响画面表情,不影响语音语调。
  • 绿幕功能需 Pro 及以上套餐):启用后,背景为纯绿色,方便后期合成到其他场景。
配置说话视频的视频设置

5. 生成说话视频

一切准备就绪后:

  • 试听音频:确认语音和节奏是否符合预期。
  • 检查积分消耗:每 15 秒视频消耗 1 积分;高清和绿幕功能会额外消耗积分。
  • 点击“生成说话视频”:VisionStory 会自动驱动角色动画,实现嘴型与台词或音频同步。

6. 最终预览与分享

视频生成后,会出现在素材库页面。你可以:

  • 预览播放最终视频,查看效果。
  • 重命名视频标题,方便素材管理。
  • 反馈意见,如对结果不满意或有改进建议。
  • 一键分享到 X(原 Twitter)或 Facebook,快速发布到社交平台。
  • 复制链接,便于在其他平台分享视频。
  • 下载 MP4 文件,保存到本地或嵌入网站。
  • 删除视频,如不再需要可随时移除。

按照以上步骤,你就能轻松制作出虚拟角色口型同步、表情丰富的高质量说话视频。借助 VisionStory,人人都能在几分钟内打造引人注目的屏幕表现力!