กูเกิลเปิดตัวโมเดล Gemini 2.0 รุ่นทดสอบ 1206 ให้ลูกค้า Gemini Advanced ใช้งาน

By: mk

on 18 December 2024 - 13:03 Tags:

Topics:

Gemini

LLM

Google

ขยันปล่อยของใหม่กันมาทุกวัน หลังจากเปิดตัว Gemini 2.0 Flash โมเดลตัวแรกในชุด Gemini 2.0 ซึ่งยังเป็นโมเดลขนาดเล็กที่สุด

กูเกิลก็เดินหน้าปล่อยโมเดลตัวใหม่ตามมาทันที ใช้ชื่อว่า Gemini-Exp-1206 เป็นโมเดลรุ่นทดสอบในตระกูล Gemini 2.0 Experimental Advanced ที่บอกว่ามีความสามารถสูงขึ้น ทั้งในเรื่องการเขียนโค้ด แก้โจทย์คณิตศาสตร์ การให้เหตุผล การทำตามคำสั่งเป็นขั้นตอน ฯลฯ

กูเกิลไม่ได้เปิดเผยตัวเลขเบนช์มาร์คเหมือนกับ Gemini 2.0 Flash แต่มีคนลองรันทดสอบกับบางงาน เช่น Text2SQL แล้ว พบว่า Gemini-Exp-1206 ให้ผลออกมาดีที่สุด

โมเดล Gemini-Exp-1206 เปิดให้ลูกค้าแพ็กเกจ Gemini Advanced แบบเสียเงินลองใช้งานแล้ว

ที่มา - Google

No Description

Gemini Advanced subscribers can try out gemini-exp-1206, our latest experimental model. Significantly improved performance on coding, math, reasoning, instruction following + more. pic.twitter.com/PyIBxspmk2

— Sundar Pichai (@sundarpichai) December 17, 2024

2024 State of LLMs for Text2SQL Tasks 🏆- Full Report🥇 Overall Performance: @GoogleDeepMind Gemini-Exp-1206🥇 Open Source Model: @Alibaba_Qwen 2.5-Coder:32b (Beats Sonnet 3.5 and on par with GPT-4o!)Disappointing performance by GPT-4o and 3.5 Sonnet on this task. 🧵 pic.twitter.com/wIKqadZqFG

— Subhash Peshwa (@Subhash_Peshwa) December 18, 2024

Hiring! บริษัทที่น่าสนใจ

CP Axtra Public Company Limited

Makro PRO is an exciting new digital venture by the iconic Makro.

MOLOG Tech

We are Modern Logistic Platform, Specialize in WMS, OMS and TMS.

Bangkok Bank

Bangkok Bank is one of Southeast Asia's largest regional banks, a market leader in business banking

Comments

By: zyzzyva

on 18 December 2024 - 22:02 #1329158

เหมือนแค้นที่ OpenAI ทำ event ตัดหน้า Google I/O เลยทำ event แทรกงาน 12 วันของ OpenAI

By: shub on 19 December 2024 - 10:53 #1329190

ตัวฟรีตอนนี้geminiมันให้โมเดลตัวไหนมาใช้นิตอบคำถามแย่มาก

By: checkmate95

on 19 December 2024 - 12:56 #1329212 Reply to:1329190

ตัวที่อยู่ในข่าวก็แย่ไม่ต่างกันครับ 😂 ไม่รู้พี่เค้าไป benchmark อิท่าไหน เหมือนเด็กเก่งข้อสอบแต่ประยุกต์ใช้ในชีวิตจริงไม่ได้ ให้ลองบวกเลขง่ายๆยังบวกผิดเลย เข้าใจว่าไม่ใช่งานที่ควรถาม llm นะแต่พี่ผิดอยู่เจ้าเดียวคนอื่นทำได้หมดก็น่าสงสัยอยู่

By: shub on 19 December 2024 - 16:50 #1329238 Reply to:1329212

ผมว่ามีปัญหาที่ข้อมูลที่ใช้เทรนมีมากเกินไป จากที่เคยได้ยินมาว่าหากใช้ข้อมูลเทรนมากถึงจำนวนหนึ่งมันจะเริ่มเอ๋อละประสิทธิภาพจะลดลง