Tags:
Node Thumbnail

SCB10X ประกาศปล่อยโมเดลปัญญาประดิษฐ์ LLM โดยรองรับหลายรูปแบบทั้งแบบขัอความปกติ, แบบรับภาพ, และแบบรับ/ตอบเป็นเสียง

ตัวโมเดลทั้งหมดพัฒนาต่อมาจากโมเดลโอเพนซอร์ส Llama-3.1/3.2, Qwen2.5 พร้อมกับโมเดลความปลอดภัย Typhoon2-Safety ที่พัฒนามาจาก mdeberta-v3-base โดยจุดสำคัญคือการสร้างชุดข้อมูลที่สะท้อนวัฒนธรรมไทย ทีมงานสร้างโมเดลปัญญาประดิษฐ์มาจัดคะแนนข้อมูลว่าเกี่ยวข้องกับประเทศไทยหรือไม่ โดยให้คะแนน 1-5 ชุดข้อมูลที่ได้คะแนนเกินเกณฑ์ในหมวดต่างๆ ก็จะถูกนำมาใช้งาน ข้อมูลอีกส่วนหนึ่งยังเป็นการสร้างจาก LLM ที่อ่านข้อความแล้วเขียนเป็นภาษาไทยในสไตล์ หนังสือเรียน, บล็อก, หรือบทความวิชาการ

ผลการฝึกนั้น Typhoon2-Llama-70B-base สามารถทำคะแนนได้ดีกว่าโมเดลตั้งต้นอย่าง Llama3.1-70B ในทุกชุดทดสอบภาษาไทย ขณะที่โมเดลเวอร์ชั่นเล็กลงไปนั้นได้คะแนนดีขึ้นหลายชุดแม้จะมีบางส่วนคะแนนแย่ลงกว่าโมเดลตั้งต้นบ้าง

โมเดลแบบ multimodal นั้นมีสองรุ่น พัฒนามาจาก Llama 3.2 และ Qwen-VL สามารถทำคะแนนได้ดีขึ้นในการทดสอบภาษาไทยกว่าโมเดลเดิมอย่างชัดเจน เช่น ชุดทดสอบ OCR (TH) โมเดล Typhoon2-Llama-3.2-11B ทำคะแนน ROGUE-L ได้ 79.51 คะแนน ขณะโมเดลตั้งต้นได้ 64.41 คะแนน

โมเดลเสียงเป็นการประกอบ encoder เพื่อสร้างอินพุตให้กับโมเดล LLM ที่เป็น Typhoon2-8B (Llama-3.1) อีกที ส่วนเอาท์พุตสร้างจากสถาปัตยกรรม Llama-Omni แล้วสร้างชุดข้อมูลจากระบบแปลงข้อความเป็นเสียงของ Google Cloud Platform เมื่อวัดคะแนนทั้งในแง่ความผิดพลาดและคุณภาพเสียง Typhoon2 เอาชนะซอฟต์แวร์แปลงข้อความเป็นเสียงแบบโอเพนซอร์สได้ แต่ยังไม่สามารถเอาชนะบริการปิดผ่าน Google Cloud หรือ Azure ไปได้ โดยรายงานระบุว่าตอนนี้หากให้พูดไทย ก็จะเหมือนฝรั่งพูดไทย ขณะที่หากให้พูดภาษาอังกฤษก็จะเหมือนคนไทยพูดภาษาอังกฤษ

โมเดลทั้งหมดเปิดให้ดาวน์โหลดแล้วบน HuggingFace

ที่มา - SCB10X

No Description

Get latest news from Blognone

Comments

By: marryboomz
Windows
on 2 January 2025 - 22:05 #1329957

อยากได้ AI ไทยที่เข้าใจความเป็นไทยได้จริง ไม่เอาแบบ AI ที่คนญี่ปุ่นมองว่าบ้านเราขี่ช้าง คนไทยต้องมีหัวโขนติดหัว5555

By: Peterfish on 3 January 2025 - 08:37 #1329976 Reply to:1329957

มีคนไทยใส่ชุดกิโมโนด้วยครับที่ผมเจอบ่อย 555

By: Tasksenger on 3 January 2025 - 12:30 #1329990 Reply to:1329957

อาจเป็นเพราะชุดข้อมูลที่ใช้ train มาจากแหล่งข้อมูลภาษาอังกฤษ และระบบ knowledge ในปัจจุบัน มันใช้วิธีการผูกชุดข้อมูลเข้ากับ entity ในรูปแบบ graph ซึ่งในการสื่อสารของหน่วยงานภาครัฐ และเอกชนของไทย มักสื่อสารกับชาวต่างชาติ โดยใช้ช้าง และโขนเป็นตัวชูโรง ทำให้ระบบระบบมันผูกความสัมพันธ์ของคำว่า Thai หรือ Thailand เข้ากับช้างและโขน พอถามคำถามเกี่ยวกับคำว่า Thai หรือ Thailand มันก็จะออกแนวๆ นี้แหล่ะครับ จะเรียกว่ามุมมองชาวต่างชาติที่มีผลทางสถิติเป็นนัยยะ มองไทยอย่างนั้นในฐานข้อมุลสาธารณะที่มีการเปิดแชร์ ซึ่งอาจเป็นจุดด้อยของ model ที่เน้นใช้ความเป็นข้อมูลทางสถิติมากกว่า ข้อเท็จจริง ซึ่งต้องก็ต้องพัฒนากันต่อไป

ในมุมมองผมเราอาจต้องมี AI กลางของแต่ละประเทศที่มีการรับรองจากหน่วยงานกำกับดูแล เพื่อให้ AI อื่นๆ ในโลกสามารถ trust เพื่อเข้ามาขอข้อมูลที่ถูกต้องไปใช้งาน หรือสอบถามข้อมูลที่เป็นทางการจากภาครัฐอีกทีนึง ซึ่งมันก็จะเป็นรูปแบบที่ต่อไป AI ไม่จำเป็นต้องเรียนรู้เองทุกเรื่อง แต่สามารถสอบถามไปยังผู้เชี่ยวชาญ หรือเจ้าของข้อมูลเองเลย โดยเหมือนคนคุยกัน แล้วตัวที่เป็น front ทำให้หน้าที่ forward คำตอบไปให้ผู้ถาม ซึ่งผมว่าน่าจะอีกนาน เพราะคงไม่มีใครอยากปล่อยขุมทรัพย์ของตัวเองให้คนอื่น แต่สุดท้ายผมว่ามันจะจบในรูปแบบนี้ คือ AI สามารถคุยกันเองได้เพื่อให้ได้แหล่งข้อมูลที่ถูกต้อง รวมถึงลดเรื่องการละเมิดลิขสิทธ์ข้อมูลที่นำไปใช้ train ได้ด้วย แถมยังสร้างรายได้ให้กับเจ้าของ content ในการให้ข้อมูลอาจอยู่ในรูปแบบเหมาจ่ายสำหรับองค์กรที่มี AI สำหรับ frontend เพื่อให้ได้ข้อมูลที่สมบูรณ์และถูกต้อง

ผมยังยืนยันว่าอนาคตทุกคนจะมี AI ในโลกดิจิทัลเป็นของตัวเอง เพื่อเก็บข้อมูล ความรู้ ความเชื่อส่วนบุคคล และสามารถให้ AI ที่เรา trust ให้ AI ของบุคคลอื่นสามารถเข้าถึงได้เฉพาะคนที่เราอนุญาติ โดยเก็บในรูปแบบเข้ารหัส ซึ่งข้อมูลเราจะคงอยู่ตลอดไปถึงแม้เราจะเสียชีวิต และยกให้เป็นมรดกของทายาทได้ หากใครไม่อยากให้ข้อมูลความรู้คงอยู่ ก็สามารถแจ้งไปยังหน่วยงานที่กำกับดูแลเพื่อให้ทำลายตัวตนในโลกดิจิทัลของเราไปด้วยกับการออกใบมรณะบัตร

อนาคต AI จะเป็นโครงสร้างพื้นฐานทางดิจิทัลที่สำคัญอย่างหนึ่งที่ทุกคนต้องมี เหมือนเครือข่ายโทรศัพท์ ไฟฟ้า น้ำประปา เลยแหล่ะ เพียงแต่เราจะให้ต่างชาติยึดมันไป หรือจะพัฒนาของเราขึ้นมาเองโดยมีทิศทางที่ชัดเจน ผมว่าถึงเวลาแล้วที่เราควรช่วยกันคิดหาคำตอบ แต่ผมว่ามีหลายองค์กรเริ่มคิด และทำแล้วล่ะ เพียงแต่อาจยังไม่ชัดเจนว่าสุดท้ายมันจะลงเอยเป็นตัวอะไร เปิดก่อนได้เปรียบ 555

ต่อไป WEB x.0 อาจมีโหมด AI เพื่อให้ AI ตัวอื่นมาถามข้อมุลไปใช้งานก็ได้ใครจะไปรู้ แต่กว่าจะถึงตรงนั้นคงต้องออกแบบ protocol ของ web ใหม่กันอีกรอบนึงเพื่อให้รองรับอะไรอีกหลายๆ อย่างที่จะเพิ่มเข้ามา อาจมี ai://xxx.th ในอนาคตก็ได้ใครจะไปรู้

By: panurat2000
Contributor Symbian Ubuntu In Love
on 2 January 2025 - 23:32 #1329964
panurat2000's picture

เมื่อวัดคะแนนทั้งแในแง่ความผิดพลาด

ทั้งแในแง่ => ทั้งในแง่

โมเดลทั้งหมดเปิดให่้ดาวน์โหลด

ให่้ => ให้