DeepMind เผยผลงานวิจัยล่าสุด พัฒนา AI ให้เล่นเกม Quake III Arena โหมดชิงธง (Capture the Flag) โดยใช้ AI หลายตัวเล่นร่วมกันเป็นทีมได้เหนือกว่ามนุษย์
Quake III Arena เป็นเกม FPS คลาสสิคของบริษัท id Software ที่ออกขายในปี 1999 และเปิดซอร์สในปี 2005 ทำให้ทีม DeepMind สามารถนำเกมมาปรับแต่งให้เหมาะกับการเรียนรู้ของ AI
บ็อตของ DeepMind ชื่อว่า FTW (For The Win) อ่านภาพบนจอแบบเดียวกับมนุษย์ (ไม่ได้รับข้อมูลพิเศษเหมือนกับบ็อตปกติของเกม) ทีมงานเลือกใช้โหมด Capture the Flag เพราะมีกฎเรียบง่าย (ชิงธงฝ่ายตรงข้ามแล้ววิ่งกลับฐาน แต่ต้องรักษาธงของตัวเองไว้ด้วย) แต่มีไดนามิกของเกมสูง และต้องใช้การเล่นร่วมกันเป็นทีมอย่างมาก เหมาะแก่การใช้บ็อตหลายตัว (multi-agent) เล่นร่วมกัน
เกมเวอร์ชันของ DeepMind ปรับแต่งให้แผนที่ในเกมเกิดขึ้นแบบสุ่ม (procedurally generated environments) เพื่อให้บ็อตที่เป็นกลาง ไม่อิงกับแผนที่ใดๆ บ็อตทุกตัวไม่ถูกสอนกฎของเกม Capture the Flag มาก่อน และให้เรียนรู้ด้วยตัวเองแบบ unsupervised learning
ทางทีมงานยังสร้างบ็อตขึ้นมาจำนวนมาก และให้เล่นร่วมกับมนุษย์ 40 คน (ทั้งจับคู่กันและแข่งขันกัน) ผลลัพธ์ออกมาเป็นว่า FTW มีความสามารถสูงกว่ามนุษย์เมื่อเทรนไปจนถึงระดับหนึ่ง บ็อตยังพัฒนากลยุทธ์ขึ้นมาแบบเดียวกับมนุษย์ เช่น รักษาฐานของตัวเอง, คอยดักรอที่ฐานของคู่แข่ง, วิ่งติดตามเพื่อนร่วมทีมไปด้วยกัน
ที่มา - DeepMind
Comments
สงสัยว่าตอนเทรน รวมถึงตอนแข่งกับมนุษย์ AI 1 ตัวบังคับตัวเล่นทั้งหมดพร้อมกัน หรือแยกกันบังคับ
คือมนุษย์ที่เล่นเป็นทีมเอง ก็ยังต้องอาศัยการสื่อสารด้วยคำพูดเพื่อคิวจังหวะ หรือต่อให้เทพๆ ก็ต้องดูเพื่อนขยับว่าตอนนี้จะบุกนะ แล้วค่อยไปตาม แต่ถ้าเป็น AI ตัวเดียวสั่งขยับพร้อมกันหมด แม้จะเห็นภาพแค่บนจอก็เถอะ ยังไงมนุษย์ก็สู้ไม่ได้นะ
แยกกันครับ ในต้นทางมีรายละเอียดตามไปดูได้ครับ
อยากเห็นการเล่นบน Map ของ Quake 3 Areana
วงการนี้ชักมันขึ้นเรื่อยๆ อีกสัก 2 ปีข้างหน้าจะมันขนาดไหนเนี่ย
น่ากลัวขึ้นทุกวันเอาหุ่นยนต์ Boston Dynamics มาติดปืนเป็นฝูง แล้วใส่ AI FTW ให้มันนี่ โหดแน่ๆ
เก่งแล้วก็มาสอนคนบ้าง
อัลกอริทึมประเภทนี้ใช้ทำระบบซิมมูเลเตอร์ทางการทหารได้สบาย ทำให้ทหารได้ฝึกวิธีการในพื้้นที่ตึกแบบไม่จำกัดรูปแบบได้เลย โดยให้ AI จำลองเป็นศัตรู
ถ้าเอา AI ตัวนี้ + AR Core บนสภาพแวดล้อมจริง ทำเป็นเกมส์ 1 Person แบบเล่นเป็นทีมได้คงมันส์พิลึก หรือเล่นผ่าน Google Cardboard ก็ได้
AI ศัตรู ถ้าหลุดไปถึงสายลับฝ่ายตรงข้านได้นี่ เป็นเรื่องแน่
ถ้ากลับ ตัวอักษร จาก FTW มันก็จะกลายเป็น WTF แน่ๆเลย ฮ่าๆ
คิดไปว่าถ้าเป็นหุ่นยนต์ติดอาวุธแล้วมี AI อย่างนี้มันจะทำได้ขนาดไหนนะ มนุษย์เราจะสู้ได้หรือเปล่าทั้งในแง่กำลังและแผนการณ์ ภาพที่ติดอยู่ในหัวจากในหนังคือหุ่นยนต์แข็งแรงกว่ามนุษย์และก็อาจจะฉลาดกว่ามนุษย์หน่อยๆ แต่ดูจากการทดลองอันนี้แล้ว ทั้งคิดแผนการณ์เองได้ ทั้งพัฒนาไปได้เรื่อยๆ จนเหนือกว่ามนุษย์มาก ดูแล้วขีดความสามารถมันสูงจริงๆ
ไม่หรอกครับมันยังมีจุดอ่อน เดียวกับมนุษย์ คือ ต้องเรียนรู้ก่อน ถ้าเราแสดงพฤติกรรมที่ ไม่มีรูปแบบ มันไม่เคยพบมาก่อน ก็จัดการได้ เพียงแต่พัฒนาการของมันที่ต่างจาก AI ตัวอื่น ตอนนี้มันเริ่มมี AI Network ของตัวเอง เมื่อตัวนึงได้เรียนรู้ ตัวอื่นก็จะเรียนรู้ไปด้วย ถ้าเป็นหุ่นยนต์ถ้าเรากำจัดมันก่อนที่มันจะเรียนรู้ก็พอไหว แต่ถ้าเป็นเกมส์ หรือ Simulator คงยาก เพราะถึงจะต่าง Object แต่แม่ข่าย AI มันก็ตัวเดียวกัน
ในโลกความเป็นจริง ทางเลือกมันเยอะกว่ามากครับ ในเกมหุ่นยนต์ตัวนึงโดนคนไล่ยิง สามารถไปหลบหลังกำแพงที่ไม่มีวันพัง พยายามยืนในจุดที่ Splash Damage จากขอบกำแพงมาไม่ถึง เรียกเพื่อนให้มาช่วย เท่านั้นก็เพียงพอ
แต่ในความเป็นจริง ถึงหลบหลังกำแพงก็อาจโดนอาวุธหนักยิงจนทะลุกำแพงได้ หรือค่อยๆ กลิ้งระเบิดมือเข้าไป หรือปีนไปยิงจากบนเพดาน ฯลฯ ซึ่งการจะคาดการณ์ได้คือต้องผ่านสมรภูมิจริงอีกเยอะมากเพื่อเก็บข้อมูลครับ
ไม่ก็ให้ AI ไปเล่น Arma.....
ตามที่ผมเข้าใจ เหมือนบ็อตเรียนรู้แบบ reinforcement learning มากกว่านะครับ แล้วใช้ unsupervised learning ในการสำรวจพฤติกรรมของบ็อตมากกว่า