تجربه کنترل بیشتر با قابلیت‌های جدید «پیش‌نمایش صدا» و «توقف» در VisionStory

Jan 12, 2025

قابلیت پیش‌نمایش صدا و توقف برای ساخت محتوای ویدیویی

ارائه محتوای ویدیویی باکیفیت، اغلب به جزئیات کوچک بستگی دارد—مانند نحوه تلفظ یک واژه یا زمان‌بندی یک مکث تاثیرگذار. با افتخار دو قابلیت جدید را معرفی می‌کنیم—پیش‌نمایش صدا و توقف—که دقت و انعطاف بیشتری را پیش از صرف اعتبار برای تولید ویدیو نهایی در اختیار شما قرار می‌دهد.

چرا پیش‌نمایش صدا؟

پیش‌نمایش صدا یک تحول اساسی برای کاربرانی است که می‌خواهند مطمئن شوند تبدیل متن به گفتار (TTS) دقیقاً مطابق انتظارشان اجرا می‌شود، پیش از آنکه اعتبار خود را برای ساخت ویدیو مصرف کنند. در گذشته، پس از نوشتن متن، مستقیماً به تولید ویدیو می‌پرداختید. این روند سریع بود اما فرصت زیادی برای اصلاحات جزئی باقی نمی‌گذاشت—و اگر اشتباهی را متوجه می‌شدید، اعتبار شما قبلاً مصرف شده بود. با پیش‌نمایش صدا می‌توانید:

  1. بررسی تلفظ و لحن
    به کل فایل صوتی تولیدشده از متن خود گوش دهید و مطمئن شوید که با سبک موردنظرتان مطابقت دارد.
  2. صرفه‌جویی در اعتبار
    با شناسایی خطاها پیش از تولید ویدیو، از مصرف بیهوده اعتبار جلوگیری کنید.
  3. جلوگیری از نویزهای صوتی لحظه‌ای
    هنگام تولید همزمان صدا و ویدیو (streaming pipeline)، برخی صداهای هوش مصنوعی ممکن است در ابتدا یا انتها دچار نوسان حجم شوند. با استفاده از پیش‌نمایش صدا، می‌توانید این مشکلات را شناسایی و نتیجه نهایی را حرفه‌ای‌تر کنید.

نکات مهم و ملاحظات متنی: با وجود پیشرفت‌های چشمگیر TTS، برخی پیچیدگی‌ها همچنان چالش‌برانگیز هستند. به موارد زیر توجه ویژه داشته باشید:

  • اصطلاحات تخصصی یا فنی: واژگان پزشکی، حقوقی یا علمی ممکن است نیاز به نشانه‌گذاری یا اصلاح املایی داشته باشند.
  • اختصارات: مطمئن شوید که TTS آن‌ها را به‌درستی تلفظ یا گسترش می‌دهد.
  • ارزها و اعداد: راوی ممکن است اعداد را با فرمتی غیرمنتظره بخواند یا نمادهای ارزی را نادیده بگیرد.
  • نشانه‌گذاری سنگین: نقطه، ویرگول و دونقطه می‌توانند بر لحن و مکث تاثیر بگذارند.

در صورت مشاهده هرگونه مشکل، کافی است متن خود را اصلاح کنید، دوباره پیش‌نمایش صدا را اجرا کنید و پیش از کلیک روی «تولید ویدیوی سخنگو»، از بی‌نقص بودن آن مطمئن شوید.

معرفی قابلیت توقف (Pause)

گاهی اوقات برای تاثیرگذاری بیشتر، تاکید بر یک عبارت یا تلفظ دقیق واژه‌ها، نیاز به مکث دارید. قابلیت جدید توقف—که از طریق آیکون «⏱ +0.5» در دسترس است—به شما امکان می‌دهد هر جا که خواستید، یک مکث کوتاه در متن خود قرار دهید. برای مکث طولانی‌تر، کافی است چندین آیکون توقف را پشت سر هم قرار دهید. این مکث دستی می‌تواند:

  • افزایش وضوح: جملات طولانی را به بخش‌های قابل فهم‌تر تقسیم کند تا شنونده بهتر متوجه شود.
  • تاکید بیشتر: پیش از بیان نکته کلیدی یا شوخی، انتظار و هیجان ایجاد کند.
  • کنترل مکث‌های TTS: اگر موتور TTS در جای مناسب مکث نمی‌کند یا مکث ناخواسته ایجاد می‌کند، با افزودن مکث دستی، روایت را مطابق میل خود تنظیم کنید.

نکات مهم

پیش‌نمایش صدا بر اساس سهمیه کاراکتری ماهانه هر پلن ارائه می‌شود. به طور تقریبی، هر ۱ دقیقه گفتار معادل ۱۰۰۰ کاراکتر است:

  • رایگان: ۵۰۰ کاراکتر (~۰.۵ دقیقه صدا)
  • لایت: ۱۰۰۰ کاراکتر (~۱ دقیقه صدا)
  • پرو: ۱۰,۰۰۰ کاراکتر (~۱۰ دقیقه صدا)
  • پیشرفته: ۵۰,۰۰۰ کاراکتر (~۵۰ دقیقه صدا)
  • اولترا: ۱۰۰,۰۰۰ کاراکتر (~۱۰۰ دقیقه صدا)

نکات مربوط به قابلیت توقف (Stopwatch):

  • هر آیکون توقف معادل ۰.۵ ثانیه مکث است و می‌توانید آن‌ها را پشت سر هم قرار دهید تا مکث طولانی‌تر (تا حداکثر ۳ ثانیه) ایجاد کنید.
  • یادآوری: از قرار دادن بیش از دو مکث متوالی در یک بخش متنی خودداری کنید، زیرا ممکن است باعث ایجاد صداهای غیرمنتظره یا نویز توسط هوش مصنوعی شود.

موارد استفاده و مزایای واقعی

  • بازاریابی و تبلیغات
    بازاریابان برای جلب توجه، از جملات کوتاه و تاثیرگذار همراه با مکث به‌جا استفاده می‌کنند. اکنون می‌توانید پیام برند خود را با پیش‌نمایش و اصلاح اجراها، بدون هدر رفت اعتبار، بهینه کنید.
  • آموزش و ویدیوهای آموزشی
    اصطلاحات پیچیده یا اختصارات در محتوای آموزشی رایج است. به‌سرعت نحوه خواندن آن‌ها را بررسی کنید، مکث مناسب اضافه کنید و یادگیری را برای مخاطب آسان‌تر نمایید.
  • داستان‌گویی و روایت
    روایت‌های دراماتیک به زمان‌بندی دقیق نیاز دارند. یک مکث به‌جا می‌تواند تعلیق یا احساسات را منتقل کند—چیزی که TTS به‌صورت خودکار همیشه به‌درستی انجام نمی‌دهد.
  • ارائه‌های حرفه‌ای
    هنگام ارائه نکات مهم—مثلاً در گزارش‌های مالی یا جلسات شرکتی—تلفظ اشتباه اسامی یا اعداد می‌تواند اعتبار شما را زیر سوال ببرد. با پیش‌نمایش و افزودن مکث، صدایی روان و حرفه‌ای خواهید داشت.