DeepMind ประกาศสาธิตปัญญาประดิษฐ์สำหรับเล่นเกม StarCraft II หลังจากแสดงความสนใจว่าจะเป็น เป้าหมายต่อไปหลังจาก AlphaGo มาตั้งแต่ปี 2016 โดยจะสาธิตผ่านสตรีมบน YouTube เวลาตีหนึ่งวันศุกร์นี้ตามเวลาประเทศไทย (คืนวันพฤหัส-ศุกร์) ทางช่อง YouTube ของ DeepMind
StarCraft II นับเป็นหลักชัยสำคัญของปัญญาประดิษฐ์ที่จะเอาชนะมนุษย์ เพราะเป้าหมายของชัยชนะในเกมมีเป้าหมายย่อยที่ซับซ้อน นับแต่การเก็บทรัพยากร, สะสมกองกำลัง, ก่อนจะใช้สิ่งที่เตรียมไว้มาทำสงครามภายหลัง ที่ผ่านมา DeepMind เคย ออกซอฟต์แวร์ SC2LE สำหรับการสร้างปัญญาประดิษฐ์เล่นเกมย่อยๆ เช่น การควบคุมการเก็บทรัพยากร
การสาธิตนี้จะพากย์โดยนักพากย์เกมชื่อดัง Dan Stemkoski และ Kevin van der Kooiเกมเมอร์ WarCraft III, StarCraft II
ที่มา - @DeepMindAI
Comments
AI จงเจริญ
พากย์
จะพากษ์โดย => จะพากย์โดย
ตามสูตรสำเร็จของ DeepMind คือตอนแรกเอาชนะมนุษย์จากการเรียนรู้เกมของมนุษย์ก่อน สเต็ปต่อไปคือเอาชนะได้จากการเรียนรู้ด้วยตนเอง (Tabula rasa) สเต็ปต่อไปคือสามารถเล่นได้หลายเกม (Generalization)
ดูยิ่งใหญ่ เหลือเกิน
แข่งกับโปรเกาหลีมั้ย?
ถ้า ai เล่นทีม 5-5 ในกติกาปกติแล้วชนะได้ ก็น่ากลัวแล้วแหละ
เป็นการเล่นแบบ 1-1 ครับเกม sc ไม่เหมือน dota ครับ ควบคุม unit หลายสิบตัวเลย
ว้าว
..: เรื่อยไป
ต่อไปจะมีแม่ทัพเป็น AI ควบคุมเหล่า Military Droneตั้งแต่ เรือดำน้ำ เรือบรรทุกเครื่องบิน เครื่องบินโจมตี/ทิ้งระเบิด รถถัง
ลาก่อนมนุษย์ชาติGoogle = SkyNet จริงๆ
Genisys คือ SkyNet
ตอน dota2 ก็แพ้มาแล้วนะ
อันนี้ยังไม่มีรายละเอียดว่าจะโชว์อะไร
แต่ตอน DoTA นี่เป็นกฎพิเศษครับ ข้อจำกัดมากกว่าการเล่นปกติ
lewcpe.com , @wasonliw
คนละบริษัทกันครับ อันนั้น OpenAI ก่อตั้งโดยอีลอน มัสก์
ถ้าเปิดมางี้ก็มั่นใจว่า AI น่าจะชนะแล้วล่ะ
อยากเห็นมันเล่น RA2 : Yuri
จะว่าไปแล้วก็ทิ้งช่วงไปนานเหมือนกันนะเนี่ย เกือบๆ 2 ปีเต็มเลย จนลืมไปแล้ว
Hardware ก็คงใช้ที่แรงขึ้นหลายร้อยหลายพันเท่าเลยมั้งเนี่ย
ใจเย็นๆ ครับ Moore's Law มันโตแค่ 2 เท่าทุก 18 เดือน
lewcpe.com , @wasonliw
แต่ TPU ไม่ได้ทำตามกฏนะสิครับ
AlphaGo ที่แข่งกับ Lee ใช้ TPU gen1 48 ตัว
พอมาเป็น AlphaZero ใช้ TPU gen2 เหลือแค่ 4 ตัว
แล้วปีที่แล้วออก TPU gen3 แรงกว่า gen2 8 เท่า
กะๆเอา TPU gen3 แรงกว่า gen1 ~ 12x8 ก็ 96 เท่า...เองมั้งครับ
มันมาเทียบกันตรงๆไม่ได้เลยครับ algorithm คนละอย่าง input คนละอย่าง ขนาดการคำนวนคนละอย่าง
TPUv1 เป็น int8 MAC ความเร็วอยู่ที่ 82T operations per second(MAC), RAM 8GB 32GBps
TPUv2 เป็น fp32 accumulate fp16 multiply MAC ความเร็ว(1 unit=4 chips)อยู่ที่ 180T fp operations per second, RAM 64GB 2400GBps
TPUv3 ไม่ได้แรงกว่า v2 8 เท่าครับ แต่แรงกว่าแค่ 2 เท่า ยัดใส่ pod เพิ่มได้ สูงสุด4 เท่า(ความเร็วต่อ pod เพิ่ม 8 เท่า)
TPU ที่ DeepMind นับนั้น ไม่ได้นับเป็น pod ครับ แต่นับเป็น TPU units จาก ภาพ ใน หน้านี้ ถ้านับเป็น pod ค่า TDP จะพุ่งไปกว่านั้นเยอะเลยครับ
ดังนั้นถ้าเอามาคำนวน inference processing output (ที่ไม่ควรจะเอามาคำนวน)จะอยู่ที่
AlphaGo 82T*48 = 3,936T ops
AlphaGo Zero อยู่ที่ 180T*4 = 720T ops ครับ
Russia is just nazi who accuse the others for being nazi.someone once said : ผมก็ด่าของผมอยู่นะ :)
จริง ๆ ถ้าจับ AI มาแข่ง Dota น่าจะดูสูสีกว่านะ เพราะ 1 คนคุม unit หลักแค่ตัวเดียว แต่เกม sc นี่ 1 คน คุม unit เกือบ 50 ตัว ใน fight 20 ตัวพร้อม ๆ กันต้องมีแหละ แล้วลองคิดดู แต่ละตัวมีสมองของตัวเอง ใช้เวทย์เอง ยิงแล้วเดินกินระยะเอง เลือดน้อยถอยออกไปเติมเลือดเอง โครตน่ากลัว ระหว่างสู้ก็สร้างฐานไปพร้อมกันได้ แบบไม่เสียเวลา แต่ถ้าเขียนให้มันเรียนรู้ทางแก้ trick ต่าง ๆ เองได้ก็ถือว่าสุดยอด ยากกว่าโกะเยอะเลย
ประเด็นไม่น่าจะใช่จำนวน units ที่ควบคุม แต่เป็น ข้อมูลของฝ่ายตรงข้ามที่ไม่เปิดเผย
โกะนี่มีข้อมูลทั้งกระดาน สามารถรู้ได้ว่าฝ่ายตรงข้าม ทำอะไรอยู่ แต่ DotA และ SC นี่มี fog of war ปิดบังไว้ ต้องสอดแนม ต้องคาดเดา
ถ้าไปลองอ่านกติกาพิเศษตอน openAI แข่ง DotA จะเห็นว่าไม่ให้ใช้ smoke , invisibility skills, invisibility items
openAI ไม่ใช่ DeepMind ทาง google คงไม่ตั้งกติกาต่างจากที่มนุษย์เล่นหรอก ไม่งั้นคงไม่เห็นความสุดยอดของ AI
ผมอธิบายให็เห็นถึงความต่างของโจทย์ครับ ไม่ใช่ความต่างของบริษัท.....
AI ตัวนี้จะให้ input แบบ virtual mouse/keyboard ครับ อย่างเช่นจะเลื่อนแผนที่ไปดูอีกจุดนึงก็ต้องใช้เม้าส์เสมือนไปแตะขอบจอ เมื่อพฤศจิกาปีที่แล้วนี่ฝีมือถึงแค่ระดับชนะ 50% กับ AI ระดับ Insane ที่แถมมากับในเกม (ที่ออกคำสั่งโดยตรง ทำให้คล้ายกับว่ายูนิตแต่ละตัวมีสมองของมันเองอย่างที่คุณบอก) แต่ AI ทั้งสองแบบมีปัญหาเหมือนกันคือทำงานเก่งเฉพาะในจุดเล็กๆหลายๆจุด แต่พอเอามาประกอบกันเพื่อให้เล่นเกมได้ตั้งแต่ต้นจนจบแล้วมันไม่เวิร์คEdited: DeepMind อัพเดตความคืบหน้าที่ BlizzCon ปีที่แล้วแต่ไม่มีใครพูดถึงเพราะโดนกระแส Diablo ทำลงเกมมือถือกลบหมด ลองดูวิดีโอเต็มๆได้ที่ https://www.youtube.com/watch?v=IzUA8n_fczU&t=1361s
มารอดูกันว่า AI มันจะส่งตัวเก็บแร่ไป survey แล้วกวนตรีนตัวเก็บแร่ฝ่ายตรงข้ามมั้ย
ready to go sir
การควบคุมระดับยูนิตเป็นแค่ปัจจัยนึงครับ ซึ่งปัจจัยที่ยากน่าจะเป็นเรื่องกลยุทธ์ เรื่องของ resource จะเร่งเก็บ resource มียูนิตสู้รบช้ากว่าในตอนเริ่ม หรือจะรีบบุก เรื่องของข้อมูลฝั่งตรงข้าม สิ่งก่อสร้างหรือยูนิตที่อีกฝั่งเลือกใช้ การขยายฐาน ทุกอย่างขึ้นกับการปรับแผน ถึง control ดีเว่อ แต่เป็นตัวแพ้ทางก็สู้ไม่ได้นะครับ
อคติทำให้คนรับเหตุผลด้านเดียว
ถ่ายทอดสดการเล่น หรือ แค่ไฮไลท์มาโชว์หว่า?
เห็นเกริ่นไว้ว่า ตัว Deepmind agent สามารถเอาชนะ AI bot ที่ระดับความยาก insane ได้ 50%
คลิ๊กเมาส์เร็วกว่า มีชัยไปกว่าครึ่งละครับ
รอชมของทางdeepmindเหมือนกันครับ ขนาดมีองความรุ้ของalphagoZeroที่เรียนรุ้ได้โดยไม่พึ่งพามนุษย์แล้วยังใช้เวลานานพอควรเหมือนกันนะครับว่าจะเอามาใช้แข่งSC2กับมนุษย์ปล.เห็นopenAI OBwardในDotaแล้วผมนี่เอามือกุมขมับ ยังอ่อนหัดยิ่งนัก
The Last Wizard Of Century.