เราเพิ่งเห็นข่าว DeepMind พัฒนา AlphaGo Zero ไม่ต้องใช้ข้อมูลการเล่นของมนุษย์ สามารถเทรนตัวเองได้จากการเล่นแข่งกับตัวเองเพียงอย่างเดียว
แนวคิดของ AlphaGo Zero ไม่ได้ใช้แค่การเล่นโกะเท่านั้น เพราะทาง DeepMind นำมันไปใช้กับหมากรุกด้วย
ชื่อของ AI เปลี่ยนมาเป็น AlphaZero (ตัดคำว่า Go ออกไป) และใช้เวลาหัดเล่นหมากรุกด้วยตัวเองเพียง 4 ชั่วโมง ก็สามารถเอาชนะโปรแกรมเล่นหมากรุกที่เก่งที่สุดคือ Stockfish ได้ ทางทีม DeepMind ยังเอามันไปฝึกเล่นหมากรุกญี่ปุ่น (โชงิ) และใช้เวลาฝึกเพียง 2 ชั่วโมงก็เอาชนะบ็อตโชงิได้
เป้าหมายของ DeepMind คือสร้าง AI ที่ทำงานทั่วไป (more generic) มากกว่างานเฉพาะทางอย่างการเล่นโกะเพียงอย่างเดียว
ที่มา - Ars Technica , ภาพจาก Pexels
Comments
ถ้าให้ AI หาวิธีช่วยโลกจากหายนะทางสิ่งแวดล้อมที่อาจเกิดขึ้นในอนาคต แล้ว คำตอบที่ได้คือกำจัดมนุษย์ออกไป นี่หนาวเลยนะ
ใจลึกๆผมก็คิดแบบ AI เลยแต่มันทำจริงๆไม่ได้
ก็ตั้เงื่อนไขก่อนได้ครับ แล้วปกติเทรน ML มันต้องเอาโมเดลมาตรวจสอบก่อนใช้งานจริงด้วย ถ้าคนมันเพี้ยนจนทำแบบนั้นเอง AI ไม่น่าจะถูกปล่อยให้คิดเอง
คิดน่ะคิดได้ แต่มันยังไม่มีระบบที่จะทำให้หนาวได้ คือ มันยังไม่สามารถเร่งแอร์ได้เอ้ย..ไม่ใช่ มันยังไม่สามารถติดต่อกับ AI อื่นๆที่จะยิงขีปนาวุธ สั่งกองทัพ หรือปิดคอมทั้งโลกได้ มันก็คิดออกมา แล้วก็ให้คำตอบ แค่นั้น
ย้อนเวลากลับมา kill Deepmind ทิ้ง
งะะะะะะ
แต่เหตุผลมันคงถูก เหอๆๆ
📸
แบบนั้นไม่ต้องเป็น AI ก็ตอบได้ครับ ใครก็ตามที่เชื่อเรื่อง Global Warming ก็รู้อยู่แล้วว่ามนุษย์เป็นต้นเหตุ
ถ้าจะให้ AI ช่วยคงต้องการคำตอบแบบที่ใช้การคำนวณลึกซึ้งกว่านั้นมาก เช่น คำนวณจากปัจจัยการเคลื่อนที่ของโลกรอบดวงอาทิตย์ กระแสน้ำ กระแสลม สภาพอากาศ แล้ว ได้คำตอบว่าควรนำสาร X ปริมาณ Y ตันไปปล่อยที่ความสูง Z เหนือพื้นดิน ที่พิกัด Lat/Long เท่านี้ๆ เพื่อให้สารกระจายตัวไปสะท้อนแสงอาทิตย์ออก ช่วยชะลอปรากฎการณ์โลกร้อนได้ โดยมีผลกระทบต่อสิ่งแวดล้อมน้อยที่สุด อะไรแบบนี้
แต่กว่าจะคำนวณได้อาจจะไม่ทันการณ์แล้ว....
นั่นมัน The 100 เลยคับ
ฝึกให้มันเล่นไพ่ป๊อกก็ดีนะครับ ตั้งชื่อว่า project เกาจิ๊งโกโฮม หมายเลข 1
เข้าใจว่าหัวข้อข่าวใช้คำว่า AlphaGo Zero เพื่อให้คนเชื่อมโยงกับข่าวเก่า แต่จริงๆแล้วมันคือ AlphaZero ที่สามารถเล่นได้ทั้งหมากรุก,หมากรุกญี่ปุ่น,โกะ
ผมเข้าใจว่า AlphaGo Zero เป็น hardware configuration ใหม่ด้วยรึป่าว, แล้วทีแรกใช้ชื่อ software เดียวกัน ตอนนี้ค่อยมาตัด go ออก?
เป็นคนละ software กันครับ
ให้มันมาคุมไฟแดงในกรุงเทพ เพื่อแก้ปัญหารถติดได้ไหม
ถ้าใส่ Input เข้าไปเยอะมากพอผมว่า AlphaZero สามารถคำนวณเวลาที่เหมาะสมในการเปิดปิดไฟแดง / เขียวทั้ง กทม ได้ครับ
ผมว่ามันทำได้ เพีียงแต่คนต้องปฏิบัติตามที่มันสั่งนะ
ผมเคยเล่นเกมส์ control traffic อันนึงในไอแพ่ด เสียดายผมจำชื่อไม่ได้ กติกาคือ ห้ามให้แยกใดแยกหนึ่งรถติดนานเกินไป ตัวเกมส์มีอยู่ Map เดียว Level เดียว ซึ่งเป็นเมืองใหญ่อย่างปารีส หรือ ลอนดอน แล้วแต่เราจะเลือก Map มีถนนพันกันเหมือนเส้นก๋วยเตี๋ยว จัดว่าเล่นยากมากสำหรับคนที่แยกประสาทไม่ได้ รวมถึงทำอะไรหลายๆอย่างพร้อมกันไม่เก่งเช่นผม
สำหรับคนทำอะไรได้ทีละอย่างเช่นผม ตอนแรกผมลองทำแบบที่ตำรวจไทยทำ คือ กั้นไว้ทางแล้วเคลียร์อีกทางให้หมด (ลองแก้ปัญหาเป็นจุดๆไป) ปากดว่าไม่ว่าจะยังไงมันเกิดสภาวะงูกินหางกันไปหมด ไม่นานก็รถติดจากแยกนึงไปแยกนึงจนเราไม่รุจะทำไงดี game over จนรู้สึกว่าเกมส์นี้มันทำมาให้ใครเล่นวะนี่ และก็เริ่มเข้าใจตำรวจไทยในยามเร่งด่วน ว่าจะหัวหมุนขนาดไหน
แต่ตอนหลังลองเล่นแบบเปิดไฟเขียวสลับไฟแดงสั้นๆ แต่เปิดๆปิดๆไปเรื่อยๆโดยมี ลำดับการเปิดแบบวนเข็มหรือทวนเข็มอย่าง Consistencyไปเรื่อยๆ สำคัญว่าต้องไม่มีแยกไหนโดนทอดทิ้งทั้วทั้ง Map ปากดว่าสามารถเล่นได้นานเท่าไหร่ก็ได้ ไม่มีวันจบ เพราะท้ายแถวไม่มีสะสม และไม่ได้ต้องใช้การแยกประสาทอะไรมากมายแค่ทำไปอย่าให้ตกหล่นก็พอ ที่สำคัญคนปฏิบัติต้องเห็นภาพรวมของสภาพถนนตลอดเวลาและเป็นคนเดียวกันหมดที่ควบคุมทั้งเมือง ซึ่งเงื่อนไขทั้งหมดทั้งปวงที่ว่านี่ คงมีแต่หุ่นยนต์ที่จะทำได้ดี
เห็นด้วยเลยครับ มันต้องเป็น AI ที่เห็นภาพรวมทั้งเมือง ถ้าแยกกันทำพอเราเปิดเขียวให้แยกแรกไปได้เยอะๆ เร็วๆ สุดท้ายมันก็ไปกระจุกตัวเพื่อเป็นปัญหารถติดในแยกถัดไป โอ้ยากอ่ะที่จะแก้ได้ถ้าไม่ใช้ระบบที่มองเห็นข้อมมูลได้ทั้งเมือง
ถึงจุดนึงมันอาจจะ Predict การฝ่าฝืนกฎจราจรที่กระทบต่อสัญญาณไฟและรถติด แล้วคำนวณการเปิดปิดไฟให้สมเหตุสมผลใหม่ก็ได้นะครับ 555
ถ้าให้ Machine Learning เก็บข้อมูลไปสักระยะ มันก็น่าจะ Predict ได้และนำมาคำนวณได้นะครับ เช่น ถ้าเปิดไฟเขียวสั้นไปไม่กี่วิแดงแล้ว หรือปล่อยให้คนรอนานๆ ก็มีแนวโน้มที่คนจะฝ่าฝืนกฎ ขอ"แถม"มากขึ้น จนส่งผลให้ท้ายแถวเลยเข้ามาในแยก รถอีกฝั่งไปไม่ได้อยู่ดี อะไรแบบนี้
หรือไม่ อาจจะต้องมี ai อีกตัวจับคนทำผิดกฏจราจร (ถ่ายรูป ส่งไปที่บ้าน) สำคัญว่ากล้องตรงนั้นอย่าซื้อมาแสนแพงแต่เผอิญ”เสียพอดี”ก็ละกัน
เคยมี Expat มะกันคนนึงมาไทย พอมาเห็นการปล่อยไฟของไทยแล้วแปลกใจ บอกที่เมืองเค้าปล่อย 1 นาทีเท่ากันหมด ไม่ใช่ฝั่งนึงไฟเขียว 30 วิ อีกฝั่งนึงเขียว 2 นาทีแบบไทย
ผิดมั๊ยที่มีคำว่า "แดง ดำ ดอก หลาม ป๊อก....."ขึ้นมาในหัว
ป๊อกมันต้องคิดด้วยเหรอ ถ้าดำมี่ ผสมสิบ นี่ จำได้แม่นๆเลย
https://www.monomaxxx.com/review/detail/twentyone
ป๊อก 21 ก็คล้าย ๆ ป๊อกเด้งของไทยแหล่ะครับ ระดับหัวกะทิ MIT
ถ้ารัมมี่นี่ AI ชนะไม่ยากเลย พื้นฐานก็จดจำไพ่ในมือตัวเองบวกที่ทิ้งลงมาของแต่ละคนในแต่ละตา รวมถึงวิเคราะห์จากไพ่ที่ทิ้งลงมาด้วยว่าบนมือแต่ละคนน่าจะมี/ไม่มีไพ่อะไร
ตาแรก AI จะรู้แน่นอนแล้ว 8 ใบคือ ไพ่ในมือตัวเอง 7 ใบ ที่หัวอีก 1ถักไปแต่ละตา อย่างน้อยๆ ต้องทิ้งลงคนละ 1 ใบคือเผยออกมาอีก 4 ใบในแต่ละตา
รวมๆกับการเกิดของผู้เล่นคนใดคนหนึ่งในระหว่างรอบตา ดังนั้นผ่านไปประมาณ 3 ตาก็เห็นไพ่เกินครึ่งสำรับ พร้อมๆกับวิเคราะห์การเกิดการทิ้งในแต่ละตาของแต่ละคน AI ก็รู้หมดแล้วว่าใครถืออะไรและเหลือไพ่อะไรบ้าง
พวกเซียนๆ ก็น่าจะประมาณความน่าจะเป็นได้ไม่หนีกับ AI เท่าไหร่แต่จะ AI จะได้เปรียบตรงที่ไม่โดนจิตวิทยาเล่นงาน
ถ้าต่อไป ชิป NN แพร่หลายจะมี AlphaLite มาให้เล่นgo/หมากรุกในมือถือมั๊ยนะ