Baidu โชว์ ERNIE 3.5 เพิ่มฟีเจอร์ปลั๊กอิน แข่งภาษาจีนชนะ GPT-4, ภาษาอังกฤษใกล้เคียง GPT-3.5

By: lew

on 27 June 2023 - 23:18 Tags:

Topics:

Baidu

LLM

Baidu ประกาศว่าเริ่มปล่อย ERNIE 3.5 ปัญญาประดิษฐ์ภาษาขนาดใหญ่ (LLM) ให้ผู้ได้รับสิทธิ์ทดสอบได้เริ่มใช้งานแล้ว โดยผลทดสอบ AGIEval ของไมโครซอฟท์ และ C-EVAL ของนักวิจัยจีนแสดงให้เห็นว่า ERNIE 3.5 เริ่มมีประสิทธิภาพใกล้เคียง ChatGPT ที่ใช้ GPT-3.5 และเมื่อแยกเฉพาะชุดทดสอบภาษาจีนเอง ERNIE 3.5 ทำคะแนนทดสอบได้ดีกว่า GPT-4

ในแง่ฟีเจอร์ ERNIE เริ่มตาม ChatGPT มาใกล้เคียงมากขึ้น โดยรองรับระบบปลั๊กอิน เบื้องต้นมีสองตัว คือ Baidu Search สำหรับค้นข้อมูลเพิ่มเติมจากเว็บ และ ChatFile สำหรับอ่านไฟล์และถามตอบข้อมูลจากไฟล์ ในอนาคตจะเปิดให้นักพัฒนาภายนอกสร้างปลั๊กอินเข้ามามาเพิ่มเติม

ทาง Baidu ไม่ได้เปิดเผยสถาปัตยกรรมภายในของ ERNIE แต่ก็บอกว่าในรุ่นนี้ปรับปรุงการเทรนให้เร็วขึ้น การคำนวณใช้ mixed-precision ที่ผสมชนิดข้อมูลในโมเดล ตลอดจนโครงสร้างภายในของ ERNIE สามารถต้นหาข้อมูลก่อนตอบได้

ตอนนี้ ERNIE ยังจำกัด เฉพาะบริษัทที่ได้สิทธิทดสอบเท่านั้น ยังไม่เปิดให้คนทั่วไปใช้งาน

ที่มา - Baidu Research

Hiring! บริษัทที่น่าสนใจ

CLEVERSE

Cleverse is a Venture Builder. Our team builds several tech companies.

KBTG - KASIKORN Business-Technology Group

KBTG - "The Technology Company for Digital Business Innovation"

Iron Software

Iron Software is an American company providing a suite of .NET libraries by engineer for engineers.

Comments

By: Mediumrare

on 28 June 2023 - 09:34 #1288251

อยากรู้อย่างเดียวเลยคือ ถ้าถามถึง "เรื่องนั้น" มันจะตอบว่าอะไร

By: akira on 28 June 2023 - 12:15 #1288280 Reply to:1288251

มันก็ตอบตามข้อมูลสถิตินั่นแหล่ะ ถึงข้อมูลที่ AI เรียนรู้จะเป็น Text แต่ในทางการพิจารณาหรือตัดสินใจก็ยังใช้คณิตศาสตร์ ด้านสถิติอยู่ดี

เช่น
สิ่งของ A -> หาข้อมูลคำอธิบายหลักจากเว็บไซต์ที่น่าเชื่อถือ
นำสิ่งของ A ไปหาว่าเจอข้อมูลที่ไหนบ้าง แนวโน้มข้อมูลส่วนใหญ่มีทิศทางในทางใด ความสนใจในสิ่งของ A เป็นเช่นไร เพื่อเลือกทิศทางคำขยายความ ถ้าพบว่าสิ่งของ A เป็นของที่มีประโยชน์ มีคนชื่นชอบ มันก็จะไปหารายละเอียดในกลุ่มข้อมูลประโยชน์ของของชิ้นนั้นมาให้ เพื่อขยายข้ออธิบายหลักอีกที ลองไปหาต้นฉบับข่าว

ป๊อป ปองกูล เป็นสมาชิกวง BNK48 -> เหตุผลเพราะช่วงเวลาที่ ChatGPT รวบรวมข้อมูลมีข่าวป๊อป กับวง BNK48 เยอะ
หลอก ChatGPT ให้หาคีย์แท้ Windows 10 ให้ -> เขาหลอก ChatGPT โดยใช้จิตสำนึกพื้นฐานของมนุษย์ในการตอบสนองกับความผิดชอบชั่วดี ทางนักวิทยาศาสตร์คงใส่ไว้ในการจำแนก input เพื่อไปเข้าสมการ แต่ปัญหาคือ มี Bug ไม่ได้ตรวจสอบ output

คุณก็จะพอรู้วิธีการที่นักวิทยาศาสตร์ข้อมูลใช้สร้างข้อมูลออกมา วิทยาศาสตร์ข้อมูลไม่ใช่ไสยศาสตร์เขาคาดคะเนพฤติกรรมของมันได้ เรื่องภาษาศาสตร์ และสถิติล้วนๆ เลยล่ะ ChatGPT เนี่ย สิ่งที่นักวิทยาศาตร์ข้อมูลสนใจไม่ใช่คำอธิบาย แต่เป็นการจำแนกวัตถุทางภาษาศาสตร์ได้อย่างถูกต้องมากกว่า

By: varshard

on 28 June 2023 - 12:43 #1288285 Reply to:1288280

ขอบคุณสำรับคำตอบสาระจริงจังครับ

เรื่องนั้นที่เขาพูดถึงน่าจะหมายถึงเรื่องจตุรัสเทียนอันเหมิน หรือเรื่องอื่นที่อาจมีการปิดกั้นโดยรัฐบาล

ถ้าเป็นเรื่องที่ต้องการ censor มันก็ทำได้อยู่ดีนี่ครับ ตั้งแต่เรื่องข้อมูลที่เอามา train หรือแม้แต่การดัก keyword ในคำถามแต่ที่เหลือก็ตามที่คุณตอบมาเลยครับ

By: akira on 28 June 2023 - 16:15 #1288320 Reply to:1288285

ผมว่าไม่น่าเทียนอันเหมิน น่าจะ 112 มากกว่าถึงไม่กล้าระบุหัวข้อผมเลยต้องเลี่ยงยกตัวอย่างเป็นสิ่งของไปถ้าเขาเข้าใจหลักการเขาก็จะรู้เองว่ามันน่าจะได้ผลประมาณไหน ส่วนเรื่อง censor มันดัก input ได้ก็จริงแต่พอเข้า neural network เราคาดเดา route ที่มันวิ่งไม่ได้หรอกครับมันมหาศาล แต่เราพอคาดเดาผลลัพธ์ได้ กรณีคีย์ windows 10 ถ้าคุณเคยอ่านต้นฉบับมาก่อนจะเห็นวิธีการเลี่ยงการตรวจจับ input ของเขา

ไม่ว่าของจีน หรือของเมกา ไส้ในก็ core เดียวกันต่างแค่ภาษาที่ใช้ train ดังนั้นหลักการนี้ใช้คาดเดาผลเพื่อเปรียบเทียบได้ครับไมว่าจะเทียนอันเหมิน หรือ 112

By: Mediumrare

on 28 June 2023 - 20:00 #1288335 Reply to:1288320

พูดถึง chatbot จีน ก็ต้องพูดถึงเทียนอันเหมินสิครับ และอีกอย่างคือก็เพราะไม่เข้าใจหลักการไงครับ ถึงต้องโพสต์ถาม แล้วก็ขอบคุณสำหรับคำตอบครับ

ปล. อ้างอิงถึงท่านที่โควตซ้อนอยู่อีกที ทางนี้ก็ต้องการรู้จริงจังนะครับ - -"

By: varshard

on 28 June 2023 - 12:40 #1288284

สามารถต้นหาข้อมูลก่อนตอบได้

สามารถ ค้น หาข้อมูลก่อนตอบได้

By: tom789

on 28 June 2023 - 12:52 #1288291

ข้อมูลมันเยอะ เอามาฝึก ai ก็เก่งขึ้น