หนึ่งในปัญหาใหญ่ของวงการภาพยนตร์, ซีรีส์ที่ทุกวันนี้มีภาพยนตร์ ซีรีส์คุณภาพดีมากมาย ที่ไม่ใช่ภาษาท้องถิ่นของประเทศที่ฉายโดยเฉพาะภาษาอังกฤษ คือความไม่พอใจของคนดู ที่ไม่อยากอ่านซับไตเติล โดยเฉพาะในสหรัฐ Hudson AI สตาร์ทอัพภายใต้ Creative Labs ของซัมซุงในเกาหลีใต้ เลยพยายามจะแก้ปัญหานี้ด้วย AI
ผลสำรวจจาก Morning Consult ของสหรัฐ สำรวจผู้ชมใน 15 ประเทศทั่วโลก พบว่ามีเพียงผู้ชมในเกาหลีใต้และจีนเท่านั้น ที่เลือกตอบว่าพอใจในการอ่านซับไตเติลสูงถึง 70% ส่วนประเทศฝั่งตะวันตกอย่างสหรัฐหรือยุโรป ส่วนใหญ่จะชอบให้ลงเสียงพากย์ทับมากกว่า
Hyunjin Shin ซีอีโอและผู้ก่อตั้ง Hudson AI บอกว่าในอุตสาหกรรมภาพยนตร์ ไม่ใช่ภาพยนตร์หรือซีรีส์ทุกเรื่อง แม้นักวิจารณ์จะชอบมากแค่ไหน ก็ใช่ว่าจะถูกซื้อไปฉายในประเทศหนึ่ง พร้อมกับการลงทุนแปลและพากย์เสียงทับ อย่างกรณีของ Parasite ของเกาหลีใต้ที่ได้ออสการ์ แต่ฉายในสหรัฐแค่ไม่กี่โรง แถมมีแต่ซับไตเติลด้วย (ซึ่ง Bong Joon-ho ผู้กำกับพูดบนเวทีลูกโลกทองคำว่า ซับไตเติลเป็นแค่ one-inch barrier) ซึ่งประเด็นนี้กลายเป็นอุปสรรคให้แง่ธุรกิจสำหรับผู้จัดจำหน่ายภาพยนตร์ต่างประเทศ
Hudson AI เลยถูกตั้งขึ้นมาเพื่อแก้ปัญหานี้ โดยเจ้าตัวเดิมทำงานอยู่ในซัมซุงอิเล็คททรอนิคส์ ที่เกาหลีใต้ และเสนอไอเดียนี้ ก่อนจะได้รับเลือกให้เข้าร่วมโครงการ accelerator ภายในบริษัทที่ชื่อว่า Creative Labs (C-Labs) และตั้งเป้าว่าจะแก้ปัญหาด้านกำแพงภาษา ให้กับอุตสาหกรรมภาพยนตร์ ด้วยการใช้ AI มาแปลงเสียงพูด พร้อมปรับปากตัวละคร ให้เป็นภาษาท้องถิ่น
กระบวนการในแปลงเสียงพูดมีอยู่หลักๆ ทั้งหมด 3 ส่วนคือ
- แปลภาษาด้วยการใช้โมเดล LLM ที่มีอยู่ในตลาด พร้อมเปิดให้นักแปลเจ้าของภาษามาขัดเกลาการถอดความสุดท้ายอีกครั้ง
- Voice Conversionกระบวนการนี้ทาง Hudson AI สร้างโมเดลในลักษณะ text-to-speech ขึ้นมาเอง โดยโมเดลสามารถเรียนรู้และรักษาโทนเสียง น้ำเสียง และความนุ่มลึกของเสียงนักแสดงต้นฉบับเอาไว้ให้ได้มากที่สุด เพื่อรักษาอรรถรสของฉากนั้นๆ
- Lip Syncเป็นอีกโมเดล AI ที่ Hudson AI พัฒนาขึ้นมาเอง ในการปรับรูปหน้าช่วงปากของนักแสดง ให้ขยับออกมาให้เคียงเสียงพูด ที่ถูกแปลออกมาแล้วได้มากที่สุด
Shin บอกว่า จุดเด่นของ Hudson AI คือความเป็นธรรมชาติ ของน้ำเสียงและการขยับปากของนักแสดง ซึ่งถึงแม้เทคโนโลยี text-to-speech จะมีมานานแล้ว แต่ก็ยังคงทำได้ไม่ดีในการถ่ายทอดเรื่องนี้ รวมถึงบอกด้วยว่าเป้าหมายของบริษัท ไม่ใช่การมาแทนที่การลงเสียงพากย์ แต่หวังเพียงแค่ช่วยอำนวยความสะดวกและกำแพงด้านการดูภาพยนตร์, ซีรีส์ต่างประเทศเป็นหลัก
ปัจจุบัน Hudson AI เพิ่งรับเงินลงทุนรอบ seed funding ไป 700 ล้านวอน (ราวๆ 18 ล้านบาท) ประมาณต้นปีที่แล้ว และเริ่มทดสอบกับบริษัทภาพยนตร์ ทั้งภายในประเทศและต่างประเทศแล้ว โดยวางแผนจะให้บริการจริงๆ ในรูปแบบของ SaaS
Comments
By Hudson
ให้เสียงภาษาไทยโดย Hudson
คือความไม่พอใจของคนดู
ลูกโลกทองคำ, Golden Globe
จำสลับ 555 ขอบคุณครับ
เห็นชื่อ Hudson แล้วนึกถึง Bomberman 😅
ผมเพิ่งมาลองนึกดู มันมีลู่ทางจะกลายเป็นนวัตกรรมเปลี่ยนโลกเหมือนกันนะ นึกภาพตามคือพอได้คนเกลาเสร็จแล้ว เสียงก็จะออกมาเป็นประโยคตรงกับที่คนเกลาทำไว้ โดยที่น้ำเสียงก็จะใกล้เคียงต้นฉบับ (ซึ่งตรงนี้ผมว่าสำคัญที่สุด) และปากก็จะขยับตรงอีกต่างหาก (ตรงนี้น่าจะทำยากสุด แต่ผมมองเป็นแค่ extra) มันพอมองออกว่าแรก ๆ มันไม่เนียนหรอก เหมือนงานวิดีโอจาก AI เมื่อไม่กี่ปีก่อน แต่ถ้าให้เวลาหรือเงินเพิ่มเข้าไปมันก็น่าคิด
จะเป็นไปได้ไหมว่าในอนาคตเวลาทำอนิเมชั่นไม่ต้องทำปาก เดี๋ยว AI จะขยับปากให้เองตามเสียงพากย์ของแต่ละประเทศ
ผมว่าแนวโน้มสูงมาก
เผลอๆเอาอัตลักษณ์น้ำเสียงของคนพากษ์ต้นฉบับ
ไปพูดเป็นภาษาแต่ละประเทศเองได้ด้วย