تجربه کنترل بیشتر با قابلیتهای جدید «پیشنمایش صدا» و «توقف» در VisionStory
Jan 12, 2025

ارائه محتوای ویدیویی باکیفیت، اغلب به جزئیات کوچک بستگی دارد—مانند نحوه تلفظ یک واژه یا زمانبندی یک مکث تاثیرگذار. با افتخار دو قابلیت جدید را معرفی میکنیم—پیشنمایش صدا و توقف—که دقت و انعطاف بیشتری را پیش از صرف اعتبار برای تولید ویدیو نهایی در اختیار شما قرار میدهد.
چرا پیشنمایش صدا؟
پیشنمایش صدا یک تحول اساسی برای کاربرانی است که میخواهند مطمئن شوند تبدیل متن به گفتار (TTS) دقیقاً مطابق انتظارشان اجرا میشود، پیش از آنکه اعتبار خود را برای ساخت ویدیو مصرف کنند. در گذشته، پس از نوشتن متن، مستقیماً به تولید ویدیو میپرداختید. این روند سریع بود اما فرصت زیادی برای اصلاحات جزئی باقی نمیگذاشت—و اگر اشتباهی را متوجه میشدید، اعتبار شما قبلاً مصرف شده بود. با پیشنمایش صدا میتوانید:
- بررسی تلفظ و لحن
به کل فایل صوتی تولیدشده از متن خود گوش دهید و مطمئن شوید که با سبک موردنظرتان مطابقت دارد. - صرفهجویی در اعتبار
با شناسایی خطاها پیش از تولید ویدیو، از مصرف بیهوده اعتبار جلوگیری کنید. - جلوگیری از نویزهای صوتی لحظهای
هنگام تولید همزمان صدا و ویدیو (streaming pipeline)، برخی صداهای هوش مصنوعی ممکن است در ابتدا یا انتها دچار نوسان حجم شوند. با استفاده از پیشنمایش صدا، میتوانید این مشکلات را شناسایی و نتیجه نهایی را حرفهایتر کنید.
نکات مهم و ملاحظات متنی: با وجود پیشرفتهای چشمگیر TTS، برخی پیچیدگیها همچنان چالشبرانگیز هستند. به موارد زیر توجه ویژه داشته باشید:
- اصطلاحات تخصصی یا فنی: واژگان پزشکی، حقوقی یا علمی ممکن است نیاز به نشانهگذاری یا اصلاح املایی داشته باشند.
- اختصارات: مطمئن شوید که TTS آنها را بهدرستی تلفظ یا گسترش میدهد.
- ارزها و اعداد: راوی ممکن است اعداد را با فرمتی غیرمنتظره بخواند یا نمادهای ارزی را نادیده بگیرد.
- نشانهگذاری سنگین: نقطه، ویرگول و دونقطه میتوانند بر لحن و مکث تاثیر بگذارند.
در صورت مشاهده هرگونه مشکل، کافی است متن خود را اصلاح کنید، دوباره پیشنمایش صدا را اجرا کنید و پیش از کلیک روی «تولید ویدیوی سخنگو»، از بینقص بودن آن مطمئن شوید.
معرفی قابلیت توقف (Pause)
گاهی اوقات برای تاثیرگذاری بیشتر، تاکید بر یک عبارت یا تلفظ دقیق واژهها، نیاز به مکث دارید. قابلیت جدید توقف—که از طریق آیکون «⏱ +0.5» در دسترس است—به شما امکان میدهد هر جا که خواستید، یک مکث کوتاه در متن خود قرار دهید. برای مکث طولانیتر، کافی است چندین آیکون توقف را پشت سر هم قرار دهید. این مکث دستی میتواند:
- افزایش وضوح: جملات طولانی را به بخشهای قابل فهمتر تقسیم کند تا شنونده بهتر متوجه شود.
- تاکید بیشتر: پیش از بیان نکته کلیدی یا شوخی، انتظار و هیجان ایجاد کند.
- کنترل مکثهای TTS: اگر موتور TTS در جای مناسب مکث نمیکند یا مکث ناخواسته ایجاد میکند، با افزودن مکث دستی، روایت را مطابق میل خود تنظیم کنید.
نکات مهم
پیشنمایش صدا بر اساس سهمیه کاراکتری ماهانه هر پلن ارائه میشود. به طور تقریبی، هر ۱ دقیقه گفتار معادل ۱۰۰۰ کاراکتر است:
- رایگان: ۵۰۰ کاراکتر (~۰.۵ دقیقه صدا)
- لایت: ۱۰۰۰ کاراکتر (~۱ دقیقه صدا)
- پرو: ۱۰,۰۰۰ کاراکتر (~۱۰ دقیقه صدا)
- پیشرفته: ۵۰,۰۰۰ کاراکتر (~۵۰ دقیقه صدا)
- اولترا: ۱۰۰,۰۰۰ کاراکتر (~۱۰۰ دقیقه صدا)
نکات مربوط به قابلیت توقف (Stopwatch):
- هر آیکون توقف معادل ۰.۵ ثانیه مکث است و میتوانید آنها را پشت سر هم قرار دهید تا مکث طولانیتر (تا حداکثر ۳ ثانیه) ایجاد کنید.
- یادآوری: از قرار دادن بیش از دو مکث متوالی در یک بخش متنی خودداری کنید، زیرا ممکن است باعث ایجاد صداهای غیرمنتظره یا نویز توسط هوش مصنوعی شود.
موارد استفاده و مزایای واقعی
- بازاریابی و تبلیغات
بازاریابان برای جلب توجه، از جملات کوتاه و تاثیرگذار همراه با مکث بهجا استفاده میکنند. اکنون میتوانید پیام برند خود را با پیشنمایش و اصلاح اجراها، بدون هدر رفت اعتبار، بهینه کنید. - آموزش و ویدیوهای آموزشی
اصطلاحات پیچیده یا اختصارات در محتوای آموزشی رایج است. بهسرعت نحوه خواندن آنها را بررسی کنید، مکث مناسب اضافه کنید و یادگیری را برای مخاطب آسانتر نمایید. - داستانگویی و روایت
روایتهای دراماتیک به زمانبندی دقیق نیاز دارند. یک مکث بهجا میتواند تعلیق یا احساسات را منتقل کند—چیزی که TTS بهصورت خودکار همیشه بهدرستی انجام نمیدهد. - ارائههای حرفهای
هنگام ارائه نکات مهم—مثلاً در گزارشهای مالی یا جلسات شرکتی—تلفظ اشتباه اسامی یا اعداد میتواند اعتبار شما را زیر سوال ببرد. با پیشنمایش و افزودن مکث، صدایی روان و حرفهای خواهید داشت.