กูเกิลประกาศความสำเร็จในซอฟต์แวร์ปัญญาประดิษฐ์ AlphaGo ที่เป็นเครือข่ายประสาทเทียมระดับลึก (deep neural networks) ทดสอบโดยการแข่งขันกับซอฟต์แวร์ปัญญาประดิษฐ์อื่นๆ ถึง 500 กระดานแล้วแพ้เพียงกระดานเดียว หลังจากนั้นจึงเชิญ Fan Hui แชมป์โกะยุโรป มาแข่งขันกับ AlphaGo ที่สำนักงานในลอนดอนจำนวน 5 กระดาน และ AlphaGo ก็สามารถชนะได้ทั้งหมด
AlphaGo เป็นเครือข่ายประสาทเทียมที่ลึกถึง 12 ชั้นและมีนิวรอนหลายล้านชุด กระบวนการทำงานมีสองเครือข่ายขนานกัน คือ policy network สำหรับการตัดสินใจว่าจะเดินหมากต่อไปอย่างไร และ value network สำหรับการคาดเดาโอกาสชนะในกระดานนั้นๆ
การฝึกเครือข่ายประสาทเทียมอาศัยบันทึกการเดินหมากของผู้เล่นที่เชี่ยวชาญ 30 ล้านหมาก เครือข่ายประสาทเทียมสามารถทำนายการเล่นของมนุษย์หลังได้รับการฝึกฝนถูกต้องถึง 57% จากนั้นจึงปล่อยให้เครือข่ายประสาทเทียมเล่นแข่งกันเองอีกหลายพันกระดาน
โกะเป็นเป้าหมายสำคัญของการพัฒนาระบบปัญญาประดิษฐ์เพราะความเป็นไปได้ในแต่ละตามีสูงมากจนความเป็นไปได้ทั้งหมดของเกมมีมากกว่าจำนวนอะตอมในจักรวาล
ที่มา - Google Blog
Comments
ชายผู้เข้าใกล้หัตถ์เทวะมากที่สุด !!
"เหมือนซูซาคุหัดเล่นโกะสมัยใหม่อย่างงั้นแหละ"
คนขี้ลืม | คนบ้าเกม | คนเหงาๆ
ลั่นนนน ฮา...
"ทำนายการเล่นของมนุษย์หลังได้รับการฝึกฝนถูกต้องถึง 57%"
แสดงว่ามันก็แทบจะเดาถูกแค่ครึ่งๆ สิ
ใช่ครับ ถูกครึ่ง ๆ แต่ไม่ใช่ "แค่" หรอกครับ
ในตาหนึ่ง ๆ เดินได้สามร้อยกว่าแบบครับหมายความว่าถ้าเดาสุ่มมีโอกาสถูกไม่ถึง 1%
ครึ่ง ๆ นี่ก็เยอะแล้วครับ
ขนาดกัน ?
มีจำนวนอะตอม ?
Skynet กำลังจะถือกำเนิด
เอาชนะระดับ 8 ดั้งได้นี้จัดว่าไม่ธรรมดาแล้วนะฝีมือจริงๆน่าจะเทียบระดับดั้งโปรได้แล้ว แต่คนธรรมดาถ้าได้ฝึกแบบนี้ยังไงก็ต้องเก่งละนะ 555
ถ้ามันคิดจะครองโลก มนุษย์คงไม่ทางสู้
มันคงคิดดักมนุษย์หลายชั้นเลยทีเดียวทีนี้
อะไรคือ จำนวนอะตอมในจักรวาล สำนวนหรือว่า หมายถึงอะตอมจริงๆ
จำนวนอะตอมในจักรวาลมีประมาณ 10^80 แต่ตาเดินที่เป็นไปได้ของโกะคือประมาณ 2x10^170
เรายังไม่รู้เลยว่าจักรวาลมีจุดสิ้นสุดตรงไหนหรือขนาดเท่าไร ทำไมเราสามารถรู้จำนวนอะตอมของทั้งจักรวาลได้หล่ะ งงอ่ะ
เป็นการเดา แบบมีหลักการ ของวิทยาศาตร์ในปัจจุบันครับ
ผมเข้าใจว่า "จักรวาล" ที่พูด ๆ กันในวิทยาศาสตร์ ส่วนใหญ่คือ จักรวาลที่สังเกตได้ (observable universe) ครับ เพราะมันเป็นไปไม่ได้ที่เราจะรู้เรื่องข้างนอกจักรวาลที่สังเกตได้ ทีนี้ พอเราสังเกตได้ เราก็รู้ขนาด และประมาณจำนวนอะตอมได้ครับ
ถ้าเปนคนฝึกฝนขนาดนี้ก็คงเทพอ่ะนะ แต่ ai มันฝึกฝนได้เรื่อยๆไม่มีขีดจำกัดซะด้วยซิ แต่ถ้าถึงขนาดเดาตาเล่นได้ถูก100%มนุษย์คงพ่ายแพ้อย่างสมบูรณ์
ดาบเดียวสะพายแล่ง
57% นี่โอกาสชนะเกินครึ่งเลยนะครับ
Fan Hui แชมป์โกะยุโรป แพ้รวดจำนวน 5 กระดานนี่ไม่ธรรมดาแล้ว
อีกอย่าง ai มันฝึกฝนได้เรื่อยๆไม่มีขีดจำกัด เพราะฉะนั้นมีแต่ค่าความสามารถจะสูงขึ้นด้วยสิ
57% นี่คือความสามารถในการคาดเดาการเล่นของมือโปรครับ มันแปลว่าซอฟต์แวร์เลียนแบบมนุษย์ได้ระดับหนึ่ง ไม่ได้แปลว่าจะชนะหรือไม่ การฝึกฝนต่อเนื่องของมันเองอาจจะทำให้มันเก่งกว่าคนแล้วก็ได้
lewcpe.com , @wasonliw
นึกถึงฮิคารุเลยแฮะ
..: เรื่อยไป
โห ลึกไปถึง 12 ชั้นเลย ใช้พลังประมวลผลมหาศาลขนาดไหนเนี่ย
เทคโนโลยีไม่ผิด คนใช้มันในทางที่ผิดนั่นแหละที่ผิด!?!
แต่ละตาไม่รู้คำนวนความน่าจะเป็นจุดทศนิยมกี่ตัว
ในอนาคต GoogleGlass + AlphaGo = ซาอิ
+1
เวลาเดินหมาก จะเห็นนิสัยของผู้เดิน วิธีการคิด และบุคลิกบางทีนี่อาจจะเป็นจุดเริ่มต้นของการมีบุคลิกจำเพาะของแต่ละ AI ทำให้ AI เข้าใกล้คำว่าความรู้สึกมากขึ้น
ขอเดินหมาชี้แนะด้วยครับ AlphaGo
You're a Ghost, driving a meat coated skeleton made from stardust,what do you have to be scared of ?
เกือบหล่อละครับติดอยู่ประโยคสุดท้ายคำเดียว 5555+
ของไทย ก็พึ่งชนะ โปรระดับต้น ๆ ของประเทศไปนะครับหมากรุกไทย
https://www.facebook.com/groups/905480066217260/permalink/909843315780935/
ทำไมไม่เอา ke jie มือ 1 ของโลกตอนนี้มาแข่งเลยอะ
อันนี้อยากให้ใช้คำว่า หมากล้อม ซึ่งมันชัดเจนกว่า GO หรือ โกะ
โกะ นี่ผมว่าก็ชัดแล้วนะครับ เป็นชื่อทางการอยู่แล้วด้วยนะครับ
เอาจริงถ้าพูดว่า หมากล้อม นี่ผมว่าค่อนข้างไม่ชัดด้วยซ้ำว่าคือหมากล้อมแบบไหน กฎคืออะไร แต่โกะคือโกะครับ = =
ผมติดตาม computer go มานานมาก ตั้งแต่ปี 2008 สมัยที่ Monte Carlo Method ทำให้กระโดดจาก 7k ไป 2k แล้วหลังจากนั้นก็ fine-tuning มาเรื่อยๆจนตันที่ 5d ในปีที่แล้ว การที่ deepmind ก้าวกระโดดจาก 5d ไป 5p นี่ทำให้ผมมองว่าการที่ google ซื้อ deepmind ในมูลค่าสองหมื่นล้านบาทนี่คือคุ้มจริง เพราะตอนปี 1997 หลัง deepblue ชนะแชมป์หมากรุก new york times บอกว่าโกะอาจจะใช้เวลาเป็นร้อยปีกว่าคอมพิวเตอร์จะชนะแชมป์
แต่ว่าใน bbc บอกว่า alphago เล่นกับตัวเองเป็นล้านครั้งนะ (ในคลิปก็บอก) ไม่ใช่แค่พันครั้ง แต่ข่าวใน bbc นี่เอาพาดหัวข่าวนี้ไปใกล้ๆกับพาดหัวข่าว google เลี่ยงจ่ายภาษีที่อิตาลี ทำเอาผมฮาเล็กน้อย
ผมยึดตามข้อความในบล็อกของกูเกิลครับ "To do this, AlphaGo learned to discover new strategies for itself, by playing thousands of games between its neural networks,...."
lewcpe.com , @wasonliw
ผมไปถามผู้รู้มาแล้วครับ On p.25 it says "The policy network was trained in this way for 10,000 mini-batches of 128 games, using 50 GPUs, for one day." So that's about 1 million games in a day, but again just the network, not the full alpha-go.
น่าจะลองแข่งกับฝั่ง Facebook นะครับ