MLCommons หน่วยงานกลางสำรวจประสิทธิภาพคอมพิวเตอร์ด้าน machine learning และปัญญาประดิษฐ์ออกรายงานเวอร์ชั่น 1.0 โดยมีผู้เข้าร่วมน่าสนใจได้แก่ NVIDIA ที่ส่งเครื่อง DGX-A100 เข้าทดสอบ, อินเทลส่ง Xeon Platinum 8380, กูเกิลส่ง TPUv4 ที่ยังไม่เปิดให้บริการทั่วไป, และ Graphcore สตาร์ตอัพปัญญาประดิษฐ์ส่งเครื่อง IPU-POD เข้าจัดอันดับ
กูเกิลโชว์ประสิทธิภาพของ Google TPUv4 แสดงให้เห็นว่าเครื่องขนาดใหญ่ที่สุดประสิทธิภาพดีกว่า NVIDIA GCX-A100 ในหลายหมวด เช่น ResNet สำหรับจัดหมวดหมู่ภาพอาจจะดีกว่า A100 ถึง 1.74 เท่าตัว อย่างไรก็ดี TPUv4 ยังไม่ได้เปิดบริการบน Google Cloud แต่อย่างใด ตอนนี้คนทั่วไปสามารถใช้งานได้เฉพาะ TPUv2 และ TPUv3 รวมถึงเครื่องมี่ใช้ทดสอบมีขนาดถึง 1,728 ซีพียู และ TPU อีก 3,456 ตัว โดยประสิทธิภาพนี้ดีกว่า TPUv3 ในการทดสอบ MLPerf 0.7 เฉลี่ย 1.7 เท่า
NVIDIA โชว์ประสิทธิภาพว่าเป็นเครื่องประสิทธิภาพสูงสุดที่หาซื้อได้จริง และประสิทธิภาพดีกว่าคู่แข่งอื่นๆ ในกลุ่มเดียวกันอย่างทิ้งห่าง ในการรันฝึกโมเดลปัญญาประดิษฐ์ 8 รูปแบบ
น้องใหม่อย่าง Graphcore ที่เพิ่งตั้งบริษัทเมื่อปี 2016 ส่งผลทดสอบจากเครื่อง IPU-POD16 และ IPU-POD64 แต่พยายามแสดงประสิทธิภาพต่อราคา โดยเครื่อง DGX-A100 ขนาด 640GB น่าจะมีราคาประมาณ 300,000 ดอลลาร์ ใช้เวลาฝึก ResNet-50 28.77 นาที ขณะที่เครื่อง IPU-POD16 ราคา 149,995 ดอลลาร์ใช้เวลาฝึก 37.12 นาที คิดออกมาเป็นประสิทธิภาพต่อราคาที่ 1.6 เท่าตัว ขณะที่การฝึกโมเดลบางแบบเช่น BERT จะทำให้ประสิทธิภาพต่อราคาลดลงแต่ก็ยังนำอยู่
ที่มา - MLCommons , NVIDIA , Google Cloud , Graphcore
Comments
เครื่องที่ใช้ทดสอบมีขนาดถึง ...
AMD ไม่สนตลาดนี้เลย