กูเกิลปล่อยโมเดล Gemini 2.0 Flash Thinking เวอร์ชั่น exp-01-21 อัพเดตจาก เวอร์ชั่นเดิมเมื่อเดือนธันวาคมที่ผ่านมา โดยเวอร์ชั่นนี้ผลทดสอบระดับสูงทำได้ดีขึ้นอย่างก้าวกระโดด
เวอร์ชั่นนี้ทำผลทดสอบ AIME (math) ได้ 73.3% และ GPQA Diamond (science) ได้ 74.2% เทียบกับ OpenAI o1 ที่ได้ AIME 78% และ GPQA ที่ 76% แม้ยังตามอยู่แต่ Gemini 2.0 Flash Thinking ก็ทำงานค่อนข้างเร็ว มีความสามารถอ่านอินพุตถึง 1 ล้านโทเค็น และสามารถรันโค้ดได้อัตโนมัติ
ฟีเจอร์ของโมเดลคิดก่อนตอบนี้ยังไม่เทียบเท่าโมเดลปกติ โดยยังขาดความสามารถค้นเว็บอัตโนมัติและการส่งเอาท์พุตเป็น JSON ตอนนี้โมเดลยังเปิดให้ใช้งานใน Google AI Studio เท่านั้น
ที่มา - @demishassabis
Comments
google ครองหัวตาราง leaderboard มายาวๆ เลยรอบนี้ลองมาตั้งแต่เมื่อคืน exp-01-21 ก็ดีจริงๆ แต่ส่วนตัวยังรัก deepseek อยู่
WE ARE THE 99%
ก้าวกระโด => ก้าวกระโดด
ไม่ชอบกราฟที่ไม่เริ่มจาก 0 เลย
flash นี่คือตัวที่เร็วกว่าปกติด้วยใช่มั้ยนะฮะ
หมายถึง .. ไม่ใช่แค่ พารามิเตอร์ น้อยกว่า , แต่ว่ามีการปรับแต่งในแง่ eff/perf ด้วย ?
หมายถึงว่ายอมแลกคุณภาพกับความเร็วน่ะฮะ
ถ้าดู model card ของ Google เองจะกลายเป็นพอๆ กับ Gemini Pro ครับ
ความเร็วคงเท่าๆ กับ Flash ตัวเดิม แต่มันเสียเวลาคิด ตอน output นี่มัน tag ได้ด้วยว่าข้อความ output เป็น thinking หรือ output
lewcpe.com , @wasonliw
หมายถึงว่าถ้าเอา Gemini Pro มาทำเป็น Thinking ด้วยแบบไม่เน้นเร็วด้วย Gemini Flash คะแนนมันอาจจะไปไกลกว่านี้น่ะฮะ