สัมผัสการควบคุมที่เหนือกว่าด้วยฟีเจอร์ “พรีวิวเสียง” และ “หยุดพูด” ใหม่ล่าสุด
Jan 12, 2025

การสร้างวิดีโอคุณภาพสูงมักขึ้นอยู่กับรายละเอียดเล็กๆ น้อยๆ เช่น การออกเสียงแต่ละคำ หรือจังหวะการหยุดพูดที่เหมาะสม เราขอแนะนำ 2 ฟีเจอร์ใหม่ พรีวิวเสียง และ หยุดพูด ที่จะช่วยให้คุณควบคุมและปรับแต่งวิดีโอได้อย่างแม่นยำและยืดหยุ่น ก่อนตัดสินใจสร้างวิดีโอจริง
ทำไมต้องใช้ฟีเจอร์พรีวิวเสียง?
พรีวิวเสียง คือจุดเปลี่ยนสำคัญสำหรับผู้ที่ต้องการให้เสียงบรรยายแปลงข้อความเป็นเสียง (TTS) ออกมาตรงใจ ก่อนใช้เครดิตในการสร้างวิดีโอจริง เดิมทีคุณต้องพิมพ์สคริปต์แล้วสร้างวิดีโอทันที ซึ่งอาจพลาดโอกาสในการปรับแต่งรายละเอียดเล็กๆ และหากพบข้อผิดพลาดก็เสียเครดิตไปแล้ว แต่ด้วยฟีเจอร์พรีวิวเสียง คุณสามารถ:
- ตรวจสอบการออกเสียงและโทนเสียง
ฟังเสียงทั้งหมดที่สร้างจากข้อความของคุณ เพื่อให้แน่ใจว่าได้สไตล์ที่ต้องการ - ประหยัดเครดิต
หากพบข้อผิดพลาดในเสียงก่อนสร้างวิดีโอ จะช่วยหลีกเลี่ยงการใช้เครดิตโดยไม่จำเป็น - หลีกเลี่ยงปัญหาเสียงผิดปกติ
เมื่อสร้างเสียงแบบสตรีมมิ่งเพื่อซิงค์กับวิดีโอ บางครั้งเสียง AI อาจมีความดังไม่สม่ำเสมอในช่วงต้นหรือท้าย ด้วยการพรีวิวเสียงก่อน คุณจะได้ผลลัพธ์ที่เนียนกว่า
ข้อควรระวังและการตั้งค่าข้อความ: แม้เทคโนโลยี TTS จะก้าวหน้า แต่ยังมีบางจุดที่ต้องใส่ใจเป็นพิเศษ เช่น
- คำเฉพาะทางหรือศัพท์เทคนิค: ศัพท์ทางการแพทย์ กฎหมาย หรือวิทยาศาสตร์ อาจต้องปรับเครื่องหมายวรรคตอนหรือการสะกด
- ตัวย่อ: ตรวจสอบให้แน่ใจว่า TTS อ่านหรือขยายความถูกต้อง
- สกุลเงินและตัวเลข: ผู้บรรยายอาจอ่านตัวเลขหรือสัญลักษณ์สกุลเงินผิดรูปแบบ
- เครื่องหมายวรรคตอนจำนวนมาก: จุด, คอมมา, โคลอน มีผลต่อจังหวะและน้ำเสียงของ TTS
หากพบปัญหาใดๆ เพียงแก้ไขข้อความ แล้วใช้พรีวิวเสียงอีกครั้งจนกว่าจะสมบูรณ์ ก่อนกด “สร้างวิดีโอพูด”
แนะนำฟีเจอร์หยุดพูด (Pause)
บางครั้งคุณอาจต้องการชะลอจังหวะเพื่อเน้นอารมณ์ สร้างความน่าสนใจ หรือออกเสียงคำยากอย่างแม่นยำ ฟีเจอร์ หยุดพูด ใหม่ของเรา—ใช้งานได้ผ่านไอคอน “⏱ +0.5”—ช่วยให้คุณแทรกช่วงหยุดสั้นๆ ในสคริปต์ได้ตามต้องการ หากต้องการหยุดนานขึ้น เพียงใส่ไอคอนหยุดพูดหลายครั้งในข้อความ ฟีเจอร์นี้ช่วยให้คุณ:
- เพิ่มความชัดเจน: แบ่งประโยคยาวๆ เพื่อให้ผู้ฟังเข้าใจแต่ละส่วนได้ชัดเจน
- เน้นย้ำข้อความสำคัญ: สร้างความคาดหวังก่อนประโยคสำคัญหรือมุกตลก
- ควบคุมจังหวะการหยุดของ TTS: หาก TTS ไม่หยุดตรงจุดที่ต้องการ หรือหยุดผิดจังหวะ การเพิ่มหยุดพูดเองจะช่วยให้เสียงบรรยายเป็นไปตามที่คุณต้องการ
เคล็ดลับสำคัญ
พรีวิวเสียง จะใช้โควต้าตามจำนวนตัวอักษร ซึ่งจะรีเซ็ตใหม่ทุกเดือนตามแพ็กเกจที่คุณสมัคร โดยทั่วไป เสียง 1 นาที ใช้ประมาณ 1,000 ตัวอักษร:
- ฟรี: 500 ตัวอักษร (~0.5 นาทีของเสียง)
- Lite: 1,000 ตัวอักษร (~1 นาทีของเสียง)
- Pro: 10,000 ตัวอักษร (~10 นาทีของเสียง)
- Advanced: 50,000 ตัวอักษร (~50 นาทีของเสียง)
- Ultra: 100,000 ตัวอักษร (~100 นาทีของเสียง)
เคล็ดลับสำหรับฟีเจอร์หยุดพูด (Stopwatch):
- แต่ละไอคอนหยุดพูดจะเพิ่มช่วงหยุด 0.5 วินาที และสามารถใช้ต่อเนื่องกันเพื่อหยุดได้นานสูงสุด 3 วินาที
- ข้อควรระวัง: หลีกเลี่ยงการใช้หยุดพูดเกิน 2 ครั้งติดกันในข้อความเดียว เพราะอาจทำให้ AI สร้างเสียงผิดปกติหรือเกิดเสียงแปลกๆ ได้
ตัวอย่างการใช้งานและประโยชน์จริง
- การตลาดและโฆษณา
นักการตลาดนิยมใช้ประโยคสั้นๆ ที่กระตุ้นความสนใจ พร้อมจังหวะหยุดที่เหมาะสม คุณสามารถปรับแต่งข้อความแบรนด์และทดลองพรีวิวเสียงได้โดยไม่เปลืองเครดิต - อีเลิร์นนิ่งและวิดีโอสอน
เนื้อหาการศึกษามักมีศัพท์เฉพาะหรือคำย่อจำนวนมาก สามารถพรีวิวเสียงและแทรกจังหวะหยุดเพื่อให้ผู้เรียนเข้าใจง่ายขึ้น - เล่าเรื่องและบรรยาย
การเล่าเรื่องที่ดีต้องอาศัยจังหวะที่แม่นยำ การหยุดพูดในจุดสำคัญช่วยสร้างอารมณ์หรือความตื่นเต้นได้ดีกว่าการปล่อยให้ TTS กำหนดจังหวะเอง - พรีเซนต์งานมืออาชีพ
ในการนำเสนอข้อมูล เช่น รายงานการเงินหรือพรีเซนต์องค์กร การออกเสียงชื่อหรือเลขผิดอาจกระทบความน่าเชื่อถือ การพรีวิวเสียงและเพิ่มจังหวะหยุดช่วยให้เสียงบรรยายดูเป็นมืออาชีพ