Microsoft Azure เปิดตัวเครื่อง VM รุ่นใหม่ Azure HBv5มีจุดเด่นที่การใช้แรม high bandwidth memory (HBM) อัตราการส่งข้อมูลสูงถึง 6.9 TB/s สูงกว่าตัวเลือกอื่นในตลาดหลายเท่า
เครื่อง VM รุ่นนี้ใช้ซีพียู AMD Epyc 4th Gen แกน Zen 4 รุ่นคัสตอมพิเศษที่ AMD ผลิตให้ไมโครซอฟท์โดยเฉพาะ หากเทียบแบนด์วิดท์กับเครื่อง Azure HBv3 รุ่นก่อนหน้า ที่ใช้ Epyc 3rd Gen (Milan-X) จะสูงกว่ากันเกือบ 20 เท่า
การที่เครื่อง Azure HBv5 มีแบนด์วิดท์หน่วยความจำเยอะขนาดนี้ จึงเหมาะกับงานคอมพิวเตอร์สมรรถนะสูง (HPC) ที่ต้องส่งข้อมูลจำนวนมากๆ โดยผู้เช่าเครื่อง VM สามารถเลือกเช่าซีพียูได้สูงสุด 352 คอร์ และอัดแรมได้สูงสุด 9GB ต่อคอร์
ซูเปอร์คอมพิวเตอร์ El Capitan ของห้องวิจัยแห่งชาติ Lawrence Livermore National Laboratory (LLNL) ขึ้นเป็นแชมป์ซูเปอร์คอมพิวเตอร์สมรรถนะสูงที่สุดในโลกเครื่องใหม่ ด้วยสมรรถนะ 1.742 Exaflop/s
El Capitan ประกาศสร้างมาตั้งแต่ปี 2019 โดยบริษัท Cray ตั้งแต่ก่อนโดน HPE ซื้อกิจการ สเปกเครื่องใช้ ซีพียู AMD Epyc Gen 4 แบบ 24 คอร์ และการ์ดเร่งความเร็ว AMD Instinct MI300A (รุ่นมีซีพียูผสมจีพียู) จำนวนคอร์รวม 11,039,616 คอร์ (อ่านว่า 11 ล้านคอร์)
Amazon เปิดบริการ AWS Parallel Computing Service (PCS) แพลตฟอร์มจัดการคลัสเตอร์คอมพิวเตอร์สมรรถนะสูง ( high performance computing หรือ HPC) ที่เครื่องทั้งหมดอยู่บน AWS EC2
PCS เป็นการนำ AWS ParallelCluster ซอฟต์แวร์จัดการคลัสเตอร์ HPC ที่ Amazon เปิดเป็นโอเพนซอร์สในปี 2018 มาผนวกกับเครื่องมืออื่นๆ แล้วจัดการระบบทั้งหมดโดย Amazon เอง (fully managed) สำหรับลูกค้าที่ไม่อยากดูแลคลัสเตอร์เอง
Gordon Bell หนึ่งในผู้บุกเบิกวงการคอมพิวเตอร์ยุคใหม่ เสียชีวิตด้วยโรคปอดอักเสบจากการสำลัก (Aspiration Pneumonia) เมื่อวันที่ 17 พฤษภาคมที่ผ่านมาด้วยวัย 89 ปี
Bell เป็นหนึ่งผู้บุกเบิกวงการคอมพิวเตอร์ยุคใหม่ เขาเป็นพนักงานยุคเริ่มต้นของ Digital Equipment Corporation (DEC) และมีส่วนร่วมพัฒนาเทคโนโลยีหลายตัว เช่น วงจรคำนวณเลขทศนิยม, ส่วนควบคุมเทป, และส่วนเชื่อมต่อข้อมูลแบบ UART ที่อาศัยการสุ่มอ่านค่า (sampling) โดยไม่ต้องการสัญญาณนาฬิกากำหนดเวลาอ่านค่า ทำให้ลดสายสัญญาณที่ต้องลากไปมาได้
Linux Foundation ประกาศตั้งองค์กรลูกชื่อ High Performance Software Foundation (HPSF) ขึ้นมาเพื่อรวมการพัฒนาซอฟต์แวร์สำหรับคอมพิวเตอร์สมรรถนะสูง high performance computing (HPC) เข้าด้วยกัน ลักษณะเดียวกับ Cloud Native Computing Foundation (CNCF) ที่กลายเป็นสังกัดของซอฟต์แวร์สำหรับคลาวด์จำนวนมาก
ซอฟต์แวร์ชุดแรกที่จะเข้ามาอยู่สังกัด HPSF ได้แก่
TOP500 ประกาศอันดับซูเปอร์คอมพิวเตอร์ประจำครึ่งแรกของปี 2024 โดยอันดับ 1-5 ยังเป็นซูเปอร์คอมพิวเตอร์ระบบเดิมจาก รอบที่แล้ว
แชมป์ยังเป็นเครื่อง Frontier ที่ครองอันดับหนึ่งติดต่อกันมา 5 สมัย มีตัวเลขสมรรถนะเพิ่มขึ้นเล็กน้อยเป็น 1.206 exaflops
เครื่องที่น่าสนใจคืออันดับสอง Aurora ที่เริ่มติดชาร์ทเข้ามารอบก่อน แต่ยังเป็นเครื่องไม่สมบูรณ์ สมรรถนะ 585.34 petaflops คราวนี้เครื่องติดตั้งเสร็จสมบูรณ์แล้ว สมรรถนะเพิ่มเป็น 1.012 exaflops ถือเป็นซูเปอร์คอมเครื่องที่สองที่ทำลายกำแพง 1 exaflops ได้สำเร็จ
ไมโครซอฟท์ร่วมมือห้องวิจัยแห่งชาติ Pacific Northwest National Laboratory (PNNL) ใช้งาน AI ร่วมกับเครื่องมือ HPC ค้นหาวัสดุชนิดใหม่ที่มาใช้กับแบตเตอรี่
โครงการนี้เป็นการคัดกรองวัสดุอนินทรีย์ที่มีศักยภาพ มากกว่า 32 ล้านองค์ประกอบ และได้ค้นพบอิเล็กโทรไลต์แข็งชนิดใหม่สำหรับโซลูชันการจัดเก็บพลังงานที่ปลอดภัยกว่าอิเล็กโทรไลต์ที่เป็นของเหลว ซึ่งอาจลดการใช้ลิเทียมในแบตเตอรี่ได้มากถึง 70%
TOP500 ประกาศอันดับซูเปอร์คอมพิวเตอร์โลกประจำรอบเดือนพฤศจิกายน 2023 ( อันดับรอบก่อน ) แชมป์อันดับหนึ่งยังเป็น เครื่อง Frontier ของ Oak Ridge National Laboratory (ORNL) ที่ครองแชมป์มา 4 สมัยติดต่อกัน สมรรถนะเท่าเดิมที่ 1.194 EFlop/s โดยใช้ซีพียู AMD EPYC 64C, ตัวเร่งประมวลผล AMD Instinct MI250x และโซลูชันของ HPE Cray EX235a
การเปลี่ยนแปลงสำคัญอยู่ที่อันดับ 2 และ 3 ที่เข้าชาร์ทมาใหม่รอบนี้
NVIDIA เปิดตัวโมดูล NVIDIA GH200 Grace Hopper รุ่นต่อไป หลังจาก ปีนี้วางตลาดรุ่นแรกไปแล้ว ความเปลี่ยนแปลงสำคัญของรุ่นต่อไปคือการใช้แรม HBM3e ทำให้ใส่แรมได้มากขึ้นมาก เครื่องขนาด 2 โมดูล สามารถใส่แรมได้สูงสุด 282GB ซีพียู 144 คอร์ และพลังประมวลผล AI รวม 8 เพตาฟลอบ (ไม่ระบุว่าที่ความละเอียดระดับใด)
HBM3e เป็นหน่วยความจำประสิทธิภาพสูงที่พัฒนาต่อมาจาก HBM3 โดยก่อนหน้านี้อาจจะเรียกว่า HBM3+ หรือ HBM3 Gen 2 ตอนนี้โรงงานที่ผลิต HBM3 หลักๆ ได้แก่ SK hynix, Samsung, และ Micro และน่าจะเตรียมสายการผลิต HBM3e กันอยู่ โดยรวมแล้วแรม HBM3e บน GH200 รุ่นต่อไปรองรับแบนวิดท์ 10TB/s
Linux Foundation ประกาศเป็นตั้งโครงการใหม่ Ultra Ethernet Consortium (UEC)เพื่อให้บริษัทและหน่วยงาน ร่วมกับพัฒนาการเชื่อมต่อบนพื้นฐานอีเธอร์เน็ต ให้รองรับการประมวลผลสมรรถะสูงได้ดีขึ้น เนื่องจากปัจจุบันงานทั้ง AI และ HPC มีรูปแบบเวิร์กโหลดที่แตกต่างไป ต้องการประสิทธิภาพการทำงานที่สูง การทำงานร่วมกันข้ามอุปกรณ์ และต้นทุนที่เหมาะสมที่สุด
บริษัทที่เข้าร่วมกลุ่ม UEC ในฐานะผู้ร่วมก่อตั้งได้แก่ AMD, Arista, Broadcom, Cisco, Eviden, HPE, Intel, Meta และ Microsoft ซึ่งต่างเป็นบริษัทที่มีประสบการณ์มายาวนานด้านเน็ตเวิร์ก AI คลาวด์ และ HPC
NVIDIA เปิดตัวเซิร์ฟเวอร์รุ่นใหม่ NVIDIA DGX GH200 ชูจุดเด่นที่รองรับแรมสูงถึง 144TB เป็นก้าวกระโดด จาก DGX H100 ที่เคยรองรับแรม 640GB ต่อเครื่อง
ภายในตัวเครื่อง ใช้ชิป NVIDIA Grace Hopper Superchip พร้อมแรมแบบ LPDDR5 480GB เซิร์ฟเวอร์แต่ละเครื่องมีซีพียู 8 ชุด และสามารถต่อข้ามเครื่องผ่าน NVLink Switches อีกถึง 256 ซีพียูในแต่ละคลัสเตอร์ ตัวชิปกราฟิกบนแต่ละโมดูลสามารถข้ามไปใช้แรมฝั่งซีพียูด้วยแบนวิดท์ 900GB/s
TOP500 ประกาศอันดับซูเปอร์คอมพิวเตอร์โลกประจำรอบเดือนมิถุนายน 2023 (ประกาศทุกครึ่งปี) อันดับหนึ่งยังเป็น เครื่อง Frontier ของห้องวิจัย Oak Ridge National Laboratory ที่ครองแชมป์มาตั้งแต่รอบเดือนมิถุนายน 2022 โดยมีตัวเลขสมรรถนะเพิ่มขึ้นเล็กน้อยเป็น 1.194 exaflop/s จากการปรับแต่งประสิทธิภาพโดยไม่ได้เพิ่มฮาร์ดแวร์ (เดิม 1.102 Exaflop/s)
NVIDIA เปิดตัวซูเปอร์คอมพิวเตอร์ Isambard 3 ที่มหาวิทยาลัย Bristol เป็นผู้สั่งซื้อ โดยความพิเศษคือมันเป็นซูเปอร์คอมพิวเตอร์ที่ใช้ ชิป Grace CPU Superchip ล้วน ไม่มีชิปกราฟิกในระบบ
ระบบรวมของ Isambard 3 ใช้ Grace CPU Superchip จำนวน 384 ชุด พลังประมวลผลรวม 2.7 petaflops ที่ FP64 จุดเด่นคือกินพลังงานเพียง 270kW เท่านั้นทำให้เป็นซูเปอร์คอมพิวเตอร์ที่ไม่มีชิปเร่งความเร็วที่ประสิทธิภาพพลังงานดีที่สุดหนึ่งในสามอันดับแรกของโลก
ศูนย์วิจัยแห่งชาติ Argonne National Laboratory (ANL) ประกาศเตรียมพัฒนาปัญญาสร้างดิษฐ์สร้างคอนเทนต์ (generative AI) ด้านวิทยาศาสตร์โดยเฉพาะ ที่มีขนาดใหญ่มากถึง 1 ล้านล้านพารามิเตอร์
ปัญญาประดิษฐ์ใหม่นี้จะฝึกด้วยข้อมูลทางวิทยาศาสตร์ทั้งหมด โดยมีข้อมูลหลายรูปแบบ ทั้งข้อความ, โค้ด, รายงานวิทยาศาสตร์ รวมถึงข้อมูลการทดลองด้านชีววิทยา, เคมี, วัสดุสาสตร์, ฟิสิกส์, การแพทย์, และข้อมูลอื่นๆ ผลที่ได้น่าจะช่วยในการออกแบบโมเลกุล สามารถแนะนำการทดลองใหม่ๆ ตั้งแต่การทดลองทางชีววิทยา, เคมี, ไปจนถึงการออกแบบยา
Meta ประกาศความสำเร็จในการสร้างซูเปอร์คอมพิวเตอร์ Research SuperCluster (RSC) เฟสที่สอง ที่เปิดตัวครั้งแรกต้นปี 2022 ตอนนี้มีสมรรถนะเกือบ 5 exaflops ถือเป็นซูเปอร์คอมพิวเตอร์อันดับหนึ่งของโลก ( แชมป์ปัจจุบัน Frontier มีสมรรถนะ 1 exaflops )
สเปกเครื่องของ Research SuperCluster (RSC) ใช้ เครื่อง NVIDIA DGX A100 จำนวน 2,000 เครื่อง นับจำนวน Tensor Core รวม 16,000 คอร์ เชื่อมต่อกันด้วย Quantum InfiniBand 16 Tb/s
กูเกิลเผยรายละเอียดของซูเปอร์คอมพิวเตอร์ที่ใช้ชิปออกแบบเอง Tensor Processing Unit (TPU) v4 ซึ่งเริ่มใช้ในโปรดักชันมาตั้งแต่ปี 2020 (แต่เพิ่งเผยรายละเอียดปี 2023) ว่าสามารถยกระดับประสิทธิภาพ machine learning ได้เกือบ 10 เท่าจากเครื่อง TPU v3 และสามารถเอาชนะเครื่องที่ใช้จีพียู NVIDIA A100 ได้ด้วย
TPU v4 เปิดตัวต่อสาธารณะเมื่อปี 2021 และ ทำผลงานเบนช์มาร์คด้าน AI ได้ดี เรื่องใหม่ที่กูเกิลเปิดเผยเพิ่มเติมในรอบนี้คือเครื่อง TPU v4 มีฟีเจอร์สำคัญ 2 ประการ
อินเทลยกเลิกโครงการ จีพียูศูนย์ข้อมูล Rialto Bridge ที่เปิดตัวในปี 2022 และมีกำหนดขายปี 2023+ โดยจะข้ามไปออกจีพียูรุ่นถัดไป Falcon Shores ในปี 2025 เลยทีเดียว
Rialto Bridge เป็นจีพียูระดับสูงของอินเทลตัวที่สอง ถัดจาก Ponte Vecchio (ชื่อทางการคือ Data Center GPU Max) ที่เพิ่งออกขายเมื่อต้นปี 2023 จับตลาดซูเปอร์คอมพิวเตอร์และคอมพิวเตอร์สมรรถนะสูง (HPC)
ท่ามกลางสงคราม AI ระหว่างบริษัทยักษ์ใหญ่ เช่น Google, Meta, Microsoft+OpenAI รวมถึงรายย่อยลงมาอย่าง Stable Diffusion ถึงแม้ยังไม่เห็นผลแพ้ชนะในเร็ววัน แต่ผู้ชนะตัวจริงอาจเป็น NVIDIA ผู้ขายจีพียูรุ่นท็อปสำหรับเทรนโมเดลขนาดใหญ่ ที่ทุกบริษัทต้องซื้อหามาใช้งาน
จีพียูยอดนิยมของวงการ AI คือ NVIDIA A100 ที่เปิดตัวในปี 2020 ราคาตัวละเกือบ 10,000 ดอลลาร์ เซิร์ฟเวอร์ทั้งชุด DGX A100 มีจีพียู 8 ตัว มีราคาขายราว 200,000 ดอลลาร์ คาดกันว่า NVIDIA ครองตลาดจีพียู AI ถึง 95% เรียกได้ว่าแทบไร้คู่แข่ง
มหาวิทยาลัย Tsukuba เริ่มทดสอบเครื่องซูเปอร์คอมพิวเตอร์ Pegasus ที่อาจจะเป็นซูเปอร์คอมพิวเตอร์ที่ประหยัดพลังงานที่สุดในตอนนี้เพราะใช้ซีพียูและกราฟิกรุ่นใหม่ ร่วมกับหน่วยความจำแบบ Intel Optane ที่ก่อนหน้านี้ไม่ค่อยประสบความสำเร็จนักจน อินเทลต้องถอยออกจากตลาดไป
Pegasus ผลิตเครื่องโดย NEC ใช้ซีพียู Xeon Platinum 8468 (Sapphire Rapids) ร่วมกับ NVIDIA H100 พร้อมกับแรม DDR5-4800 อีก 128GB ที่น่าสนใจคือตัวเครื่องใส่ Intel Optane มาด้วยอีก 2TB แยกออกจาก SSD ขนาด 3.2TB อีกสองชุด เชื่อมต่อเน็ตเวิร์คด้วย NVIDIA Quantum-2 Infiniband (200Gbps)
อินเทลเปิดตัวแบรนด์ซีพียูและจีพียูฝั่งศูนย์ข้อมูลคือ Intel Xeon CPU Maxและ Data Center GPU Max
สินค้าทั้งสองตัวเปิดตัวมาก่อนแล้ว เพียงแต่เรียกเป็นโค้ดเนมเท่านั้นคือ ซีพียู Xeon "Sapphire Rapids" (เวอร์ชัน Max ใช้แรมแบบ HBM) และ จีพียู Ponte Vecchio ชิปทั้งสองรุ่นจะเริ่มวางขายในเดือนมกราคม 2023
ทั้ง Xeon CPU Max และ Data Center GPU Max ถูกใช้ใน ซูเปอร์คอมพิวเตอร์ Aurora ของศูนย์วิจัยแห่งชาติ Argonne National Laboratory ที่กำลังสร้างอยู่ มีสมรรถนะรวม 2 exaflops และกำหนดเสร็จในปี 2023
Tesla อัพเดตความคืบหน้าของ Dojo ซูเปอร์คอมพิวเตอร์ที่บริษัทออกแบบเองเพื่อเทรน AI ที่ใช้ในระบบขับขี่อัตโนมัติ และ เปิดตัวต่อสาธารณะครั้งแรกช่วงกลางปี 2021
Tesla บอกว่าเมื่อขนาดของโมเดลใหญ่ขึ้นเรื่อยๆ จนไม่มีเครื่องขนาดใหญ่มากพอที่จะรัน ทางออกเดียวคือการสร้างเครื่องคอมพิวเตอร์ที่ใหญ่มากพอขึ้นมาเอง
ซูเปอร์คอมพิวเตอร์ Dojo ถูกออกแบบมาใหม่ทั้งหมด ภายใต้วิสัยทัศน์ว่าต้องเป็นตัวเร่งการประมวลผล (accelerator) ผืนใหญ่ผืนเดียว (single scalable compute plane) ใช้ชิปออกแบบเองที่เรียกว่า D1 นำมาต่อกับ I/O + Power + Cooling กลายเป็น Training Tile ซึ่งบอกว่ามีพลังเท่ากับจีพียู 6 ชุดเลยทีเดียว
การวัดประสิทธิภาพการฝึกโมเดลปัญญาประดิษฐ์ MLPerf ประกาศผลรอบใหม่ ทำให้ผู้ผลิตรายหลักๆ ก็ออกมาเคลมชัยชนะในมุมของตัวเองกัน
Google Cloud นั้นส่งผลทดสอบของ TPU v4 เข้าร่วม และโชว์ว่าแรงกว่าเซิร์ฟเวอร์ "ที่หาซื้อได้" (available on-prem) อย่างชัดเจน โดยเครื่องที่ Google Cloud ส่งผลทดสอบนั้นสามารถเปิดใช้งานได้จริงผ่านบริการ ML hub
อินเทลมีจีพียูสำหรับคอมพิวเตอร์สมรรถนะสูงชื่อ Ponte Vecchio ที่เปิดตัวครั้งแรกในปี 2019 โดยจะใช้กับ ซูเปอร์คอมพิวเตอร์ Aurora ของกระทรวงพลังงานสหรัฐ มีกำหนดเสร็จช่วงปลายปี 2022
จีพียู Ponte Vecchio (นำชื่อมาจาก สะพานโบราณในเมืองฟลอเรนซ์ ประเทศอิตาลี ) มีแนวคิดใหม่ๆ หลายอย่าง นอกจากใช้ สถาปัตยกรรม Xe ตามแนวทางจีพียูอินเทลสมัยใหม่ ยังนำแนวคิดเรื่อง tile หรือชิปย่อยๆ ที่ทำงานหน้าที่ต่างกัน ผลิตคนละโรงงานกัน (บาง tile ผลิตโดย TSMC) นำมาประกบกันแบบแนวตั้ง เป็น แพ็กเกจชิปที่อินเทลเรียกว่า Foveros รายละเอียดสามารถอ่านได้จาก บทความเรื่อง Ponte Vecchio
ถึงแม้ Ponte Vecchio ที่ใช้ในเครื่อง Aurora ยังไม่เสร็จสมบูรณ์ดี ล่าสุดอินเทลเปิดตัวจีพียูรุ่นที่สองแล้ว ใช้ชื่อว่า Rialto Bridgeซึ่งเป็น สะพานโบราณในเมืองเวนิส
อันดับซูเปอร์คอมพิวเตอร์โลก TOP500 ประจำรอบเดือนมิถุนายน 2022 (จัดปีละ 2 ครั้งทุกเดือนมิถุนายนและพฤศจิกายน) มีการเปลี่ยนแปลงสำคัญคือมีแชมป์ใหม่ ซูเปอร์คอมพิวเตอร์ Frontier ของห้องวิจัย Oak Ridge National Laboratory (ORNL) ของสหรัฐ แถมยังเป็นซูเปอร์คอมพิวเตอร์เครื่องแรกของโลกที่มีสมรรถนะ 1.102 Exaflop/s ทะลุกำแพง Exaflop ได้เป็นครั้งแรก
NVIDIA เปิดตัวชุดเซิร์ฟเวอร์ DGX H100 ที่ใช้ ชิป H100 สถาปัตยกรรม Hopper โดยเปิดตัวทั้งแบบเซิร์ฟเวอร์เดี่ยว DGX H100, ชุดระดับตู้เซิร์ฟเวอร์ DGX POD, และระบบขนาดศูนย์ข้อมูล DGX SuperPOD
ชุดใหญ่สุดคือ DGX SuperPOD นั้นรองรับโหนดรวม 32 โหนด มีชิป H100 ทั้งหมด 256 ชุด พลังประมวลผลรวม 1 exaflops ที่ FP8
เพื่อแสดงพลังของเซิร์ฟเวอร์ชุดใหม่ ทาง NVIDIA จะสร้างซูเปอร์คอมพิวเตอร์ Eos ใช้ DGX H100 รวม 576 เครื่อง มีชิปกราฟิก H100 ทั้งหมด 4,608 ชุด คาดว่าจะมีพลังประมวลผลปัญญาประดิษฐ์รวม 18.4 exaflops และพลังประมวลผลวิทยาศาสตร์ 275 petaflops คาดว่าจะรันเครื่อง Eos โชว์ได้ในปีนี้