IBM ประกาศข้อตกลงกับ NVIDIA ในการนำจีพียูตระกูล Tesla ไปใส่ในเซิร์ฟเวอร์แบรนด์ Power Systems ที่ใช้ซีพียูตระกูล POWER8 ของ IBM เอง
Tesla จะมีสถานะเป็นตัวช่วยเร่งการประมวลผล (GPU accelerator) ที่แบ่งเบาภาระงานบางอย่างจากซีพียู เพื่อประสิทธิภาพโดยรวมที่ดีขึ้นของระบบ ลูกค้าของเซิร์ฟเวอร์กลุ่มนี้มักเป็นหน่วยงานขนาดใหญ่ของรัฐที่เน้นการวิจัย งานด้านการประมวลผลขนาดใหญ่ และการวิเคราะห์ข้อมูล
แนวคิดเรื่องการนำจีพียูมาช่วยประมวลผลในเซิร์ฟเวอร์ขนาดใหญ่ไม่ใช่เรื่องใหม่ ซูเปอร์คอมพิวเตอร์ที่เคยเร็วที่สุดในโลกอย่าง Jaguar/Titan ก็ช้ Tesla เป็นหน่วยประมวลผลเสริม และ NVIDIA เองก็เคยออก Tesla Personal Supercomputer มาขายเช่นกัน
ที่มา - NVIDIA
Comments
cpu กะ gpu มันประมวลผลแตกต่างกันยังไง สมัยนี้เน้น gpu จัง
ถ้าเอาแบบง่ายที่สุด
CPU => พนักงาน 7-11 ฉายาแคชเชียร์มือลิง เคลียร์ลูกค้าได้นาทีละ 30 คน มีพนักงานอยู่ 4 คน (Quard-core)GPU => พนักงาน 7-11 ฝึกหัด เคลียร์ลูกค้าได้นาทีละ 3 คน แต่มีพนักงานอยู่ 1000 คน
ก็เหมาะกับงานคนละแบบล่ะครับ อย่าไปยึดตัวเลขความเร็วที่ผมสมมตินะครับ มั่วแบบไม่มีความเกี่ยวข้องกับของจริง (แต่จำนวนพนักงานนั่นของจริง)
พอจะทราบเปล่าอะครับ ว่างานประเภทไหน เหมาะกับ GPU มากกว่า CPU เดิมๆ
เท่าที่ผมรู้คืองานที่ประมวลผลแบบขนานได้หลายๆ แถวครับ ยิ่งถ้าไม่ต้องใช้ข้อมูลเยอะน่าจะดีเพราะต้องมีการ copy ข้อมูลระหว่างแรมเครื่องกับแรมการ์ดจอตลอดเวลา
แต่ผมก็ไม่เชียวชาญนะครับ ไม่แน่ใจขนาดนั้น เคยลองแค่ CUDA บน 8400M GS แรม 64 MB สั่งงานอะไรแทบไม่ได้เพราะแรมน้อย ต้องปิด aero ปิดนู่นนี่ทุกอย่าง ปรับ theme เป็น classic แล้วก็ปรับความละเอียดหน้าจอลงด้วย ผลคือคำนวณงานที่ทดสอบได้เร็วกว่า Core 2 Duo T7500 2.2GHz แบบเห็นผลครับ ตอนนั้นเหมือนจะเป็นการ brute-force อะไรสักอย่าง
การประมวลผล แบบขนาน เป็นงานอย่างไรแล้วเช่น 1+1=2 หรือป่าว ได้เลขแล้วก็จบแล้วการประมวลผลข้อมูลแบบอนุกรมที่ CPU ทำเป็นงานยังไงหรอรับ หรืแว่าแค่เอา 2ซึ่งมาจาก 1+1 มาคิดต่ออีกที
ที่ผมพิมมาคือที่คิดนะครับ อยากหาคนอธิบาย
ผมขอตัวช่วยครับ - -" ความสามารถผมไม่ถึงแล้วตรงนี้ (T^T)
งานคำนวณบน CPU หรือ GPU ต่างกันตรงที่ว่า ความเหมาะสมของงานที่จะทำขึ้นอยู่กับความซับซ้อนของงานที่เมื่อแบ่งงานไปทำพร้อมๆกันแล้วนำผลงานมารวมกันจะยุ่งยากมากแค่ไหน
อย่างเช่น ร้านอาหารมีงานส่วนของ การปรุงอาหาร กับ การล้างจาน แล้วสมมุติว่าแต่ละแกนของ CPU หรือ GPU ก็คือแต่ละคน ที่มีความสามารถไม่เท่ากัน
งานปรุงอาหาร(1 เมนู) มีขั้นตอนยุ่งยากมากมาย ใช้เครื่องมือปรุงอาหารหลายอย่าง ใช้วัตถุดิบหลายอย่าง ตั้งแต่ต้นจนจบงาน จึงเหมาะที่จะทำงานคนเดียว (ถ้าคนอื่นมาช่วย แบ่งงานไปทำ เสร็จแล้วตอนนำแต่ละส่วนประกอบมารวมกัน อาจไม่เป็นอันจะกิน) แบบนี้ก็ส่งให้ CPU ทำงานตั้งแต่ต้นจนจบไปง่ายกว่า เพราะเขียนโปรแกรมให้ CPU ทำงานซับซ้อนได้ง่ายกว่า
ส่วน การล้างจาน(1 เข่ง) ไม่มีขั้นตอนยุ่งยาก ใช้แค่ฟองน้ำกับน้ำยาล้างจาน แค่ทำซ้ำๆกันกับจานหลายๆใบ งานนี้หลายๆคนช่วยกันทำได้ พอแต่ละคนทำเสร็จแล้วก็แค่เอาจานมากองรวมกันก็เสร็จ แบบนี้ก็ส่งงาน กระจายให้แต่ละแกนของ GPU ที่มีจำนวนมากมายทำงานกันไป เสร็จเร็วกว่าเยอะ
ที่คิดตัวอย่างได้ก็ประมาณนี้ล่ะครับ ไม่รู้จะเข้าใจกันรึเปล่านะ
GPU ประมวลผลทศนิยมลอยตัว Floating Point ได้เยี่ยมที่สุดในสามโลก ถามว่างานอะไรบ้างที่ต้องใช้พลังคำนวนขนาดนั้น
นั้นคือ งาน Multimedia ทุกประเภทครับ เอาง่ายๆ
CPU เป็นตัวที่บอกว่า ไข่ + แมกกี้ + มะนาว = ไขเจียวฟูๆ
แต่คุณจะเอาไข่เจียวฟูๆ 1000,000,000,000 ฟอง
CPU เปรียบเหมือน CEO แหละครับ รู้ว่าจะต้องทำอย่างไร ให้ได้สิ่งที่ต้องการ แต่ไม่ถนัดทำ สั่งวิธีการได้ จะต้องใช้อะไร ใส่อะไร แปรรูปยังไง ให้ได้ผลลัพท์ กระบวนการนี้ยากที่สุดครับ
แต่... ท่านเคยเห็นผู้บริหารลงมาประกอบใน Line ผลิตไหม? ไม่ครับ เพราะอะไร เขาแค่ "คิดเก่ง" แต่ "ไม่เก่งทำ"
GPU เปรียบเหมือนสาวโรงงาน ที่มือคล่องยังกับอะไรดี ขอให้บอก ทำยังไง 1. 2. 3. 4. ใส่ x .ใส่ y ใส่ Z พลิกซ้ายขวาหน้าหลัง งานไม่ยาก ไม่ซับซ้อน แต่ต้องการความไว ความชำนาญ และต้องมีข้อมูลเตรียมกองไว้ตรงหน้า เพื่อหยิบมาเป็น ชิ้นงาน
GPU สามารถทำงานซ้ำซ้อน ไม่ใช่ ซับซ้อน นะครับ ข้อมูลพวกงาน multimedia นี่คือ ชิ้นส่วนเล็กๆ สาว GPU จะนำข้อมูลไปเข้าสมการ ตามที่ CPU สั่งมา อาศัย สาวโรงงาน 3000 คนทำงานแยกชิ้นกัน
คนที่ 1 ทำงานวินาทีที่ 1-5
คนที่ 2 ทำงานวินาทีที่ 6-10
................
................
...........
......
..
.
คนที่ 3000 ทำงานวินาทีที่ 55001-60000
งานนี้ถ้าให้ CPU ทำน่าจะใช้เวลาเกือบ 3000 หน่วยแต่ GPU สามารถทำงานนี่เสร็จใน 1 หน่วยเวลา
งานประเภทนี้ที่เราๆท่านๆ ใช้บ่อยที่สุดคือ งาน Encode วีดีโอ หรือ แปลงไฟล์ส่วนงานใน Server คือ งานสร้างภาพ animation
+1024
งาน Encode ทั้งหลาย นี่แหละเหมาะ
งานนี้ AMD มีหนาว