NVIDIA โพสต์บล็อกผลการทดสอบรันโมเดล DeepSeek R1 Distill ด้วย llama-bench ที่ขนาดพารามิเตอร์ต่าง ๆ โดยบอกว่า GeForce RTX 4090 เร็วกว่า AMD Radeon RX 7900 XTX ถึง 47% และถ้าใช้ RTX 5090 จะเร็วมากกว่า 100% เลย
การทดสอบนี้คาดว่าเพื่อตอบโต้ AMD ที่เผยแพร่ผลทดสอบการรัน DeepSeek ก่อนหน้านี้ว่า Radeon RX 7900 XTX เร็วกว่า RTX 4090 อย่างไรก็ตามด้วยตัวเลขที่ออกแตกต่างกัน จึงอาจมีความแตกต่างในทดสอบของแต่ละค่าย ก็ต้องรอดูรายละเอียดเพิ่มเติมกันต่อไป
Liang Wenfeng ผู้ก่อตั้ง DeepSeek ถูกยกย่องให้เป็นวีรบุรุษ หลังจากที่เขาเดินทางไปฉลองตรุษจีนที่หมู่บ้าน Mililing เมืองจ้านเจียง มณฑลกวางตุ้ง หรือบ้านเกิดของเขา พร้อมกับบอดี้การ์ดจำนวนหนึ่ง
ชาวบ้านบอกว่า พวกเขารู้สึกภูมิใจมาก หลังจากที่ Liang ได้นำเกียรติยศมาสู่ชุมชน จากอิทธิพลของ DeepSeek ที่แสดงให้เห็นว่า โมเดล AI ที่ทรงพลังมากขนาดนี้ สามารถพัฒนาด้วยชิป NVIDIA รุ่นรอง ซึ่งได้สร้างปรากฏการณ์ให้กับแวดวงเทคฯ ของจีน และ สะเทือนไปถึงบิ๊กเทคฯ ของสหรัฐฯ หลังกีดกันไม่ให้จีนเข้าถึงชิประดับไฮเอนด์
NVIDIA ชี้แจงถึงประเด็นที่ สหรัฐฯ สอบสวนว่า DeepSeek ได้ชิปของบริษัทไปทางใด โดยประเทศต้องสงสัยหนึ่งคือสิงคโปร์ เพราะเป็นประเทศที่สร้างยอดขายให้ NVIDIA ถึง 22% จึงเป็นที่น่าสงสัยว่าประเทศขนาดเล็กจะซื้อการ์ดกราฟิกไปขนาดนี้เพื่ออะไร
ทาง NVIDIA ระบุว่าการแยกรายได้นั้นเป็นการแยกรายได้ตามประเทศที่เรียกเก็บเงิน (bill to) ไม่ได้แยกตามการส่งสินค้าจริง ลูกค้าจำนวนมากใช้บริษัทในสิงคโปร์เป็นผู้จ่ายเงิน แม้ว่าที่จริงแล้วตัวเครื่องจะส่งไปยังสหรัฐฯ หรือยุโรปก็ตาม
ด้านกระทรวงอุตสาหกรรมสิงคโปร์ระบุว่าเป็นหน้าที่ของ NVIDIA ต้องทำตามข้อบังคับการส่งออกของสหรัฐฯ และศุลกากรของสิงคโปร์ยินดีจะทำงานร่วมกับสหรัฐฯ เพื่อบังคับใช้กฎหมายต่อไป
Greg Abbott ผู้ว่าการรัฐเท็กซัสออกคำสั่งห้ามเจ้าหน้าที่ของรัฐ ติดตั้งแอปโซเชียลมีเดียและแอปปัญญาประดิษฐ์ของบริษัทจากประเทศจีนลงอุปกรณ์ของหน่วยงานรัฐ ด้วยเหตุผลด้านความปลอดภัย
คำสั่งนี้ไม่ได้เป็นเรื่องใหม่สำหรับรัฐเท็กซัส เพราะ รัฐเคยออกคำสั่ง แบบเดียวกันมาแล้วเมื่อปี 2022 แต่เจาะจงไปที่ TikTok แอปเดียว
รายชื่อแอปที่อยู่ในคำสั่งรอบนี้ได้แก่ RedNote , DeepSeek , Webull, Tiger Brokers, Moomoo และ Lemon8
มีรายงานว่ากระทรวงพาณิชย์ของสหรัฐ ได้เริ่มตรวจสอบว่า DeepSeek ใช้ชิปของสหรัฐที่ถูกระบุว่าห้ามส่งออกไปจีนในการพัฒนาโมเดล AI หรือไม่ ซึ่งเป็น คำสั่งที่ออกมาตั้งแต่ปี 2023 โดยบริษัทที่ได้รับผลกระทบมากที่สุดก็คือ NVIDIA เพราะโดนทั้ง A100, A800, H100 และ H800
รายงานบอกว่าชิป AI เหล่านี้ถูกลักลอบนำเข้าจีนผ่านประเทศตัวกลางหลายแห่ง โดยก่อนหน้านี้ Dario Amodei ซีอีโอ Anthropic ให้ข้อมูลว่าชิป AI ที่ DeepSeek ใช้พัฒนาโมเดล AI นั้น มีผสมกันทั้งชิปปกติที่ไม่ถูกแบน, ชิปถูกแบนแต่ซื้อมาก่อนคำสั่งมีผล และชิปที่ใช้การลักลอบนำเข้า
คล้อยหลัง Microsoft Azure เปิดให้เช่าโมเดล DeepSeek R1 เพียงแค่วันเดียว ฝั่งของ AWS ก็เปิดบริการ DeepSeek R1 แบบเดียวกันผ่าน Amazon Bedrock และ Amazon SageMaker และที่ไม่ธรรมดาคือ Andy Jassy ซีอีโอของ Amazon โพสต์ข้อความช่วยโปรโมทให้เป็นพิเศษด้วย
Amazon บอกว่านโยบายของตัวเองคือเปิดให้ลูกค้าเลือกโมเดลที่ต้องการได้เอง ดังนั้นบริษัทจะพยายามหาโมเดลที่ผู้ใช้เรียกร้องมาให้เยอะที่สุด
เนื่องจากโมเดล DeepSeek-R1 เป็นโมเดลโอเพนซอร์สอยู่แล้ว AWS จึงไม่คิดค่าโมเดล และคิดเฉพาะค่าเช่าเครื่องที่ใช้รันเท่านั้น สามารถเลือกเครื่องที่ใช้ชิป Trainum และ Inferentia ที่ AWS ออกแบบเองเพื่อให้ค่าใช้จ่ายต่ำลงได้ด้วย
AMD เกาะกระแส DeepSeek ด้วยการโชว์เบนช์มาร์คว่าจีพียู Radeon RX 7900 XTX สามารถรันโมเดล DeepSeek R1 Distill (เวอร์ชันย่อยให้เล็กลงแล้ว) ได้แรงกว่าคู่แข่ง GeForce RTX 4090 สูงสุด 13% (ตามภาพท้ายข่าว)
โมเดลที่นำมารันโชว์มีทั้ง DeepSeek R1 Distill ที่ถอดมาจาก Alibaba Qwen และ Meta Llama ที่ขนาดพารามิเตอร์หลายแบบ โดยโมเดลที่ขนาดเล็กกว่า เช่น 7B จะเห็นความแตกต่างของการรันบนชิป AMD กับ NVIDIA ได้มากกว่าโมเดลขนาดใหญ่
วิธีการติดตั้งและรัน DeepSeek R1 Distill ในพีซี สามารถดูได้จากคลิปท้ายข่าว
ที่มา - AMD
Wiz บริษัทวิจัยความปลอดภัยไซเบอร์รายงานถึงการสำรวจความปลอดภัยของบริษัท DeepSeek พบว่าบริษัทเปิดบริการภายในออกสู่อินเทอร์เน็ตจำนวนมาก รวมถึงฐานข้อมูล ClickHouse ด้วย ทำให้ข้อมูลรั่วไหลจำนวนมาก
เซิร์ฟเวอร์ที่เปิดไว้นี้อยู่ที่ dev.deepseek.com:9000
เป็นฐานข้อมูลสำหรับการเก็บ log ของบริการ โดยตัว log แสดงข้อมูลทั้ง API Endpoints ภายในของ DeepSeek เอง, ประวัติการสนทนา, ข้อมูลอื่นๆ ที่เกี่ยวกับแชต
ทาง Wiz เตือนว่าตอนนี้บริการ AI ต่างๆ เกิดขึ้นอย่างรวดเร็ว และบริษัทเหล่านี้อาจจะขยายบริการโดยไม่ได้มีเฟรมเวิร์ความปลอดภัยที่เพียงพอ การใช้งานจึงควรระมัดระวัง
ที่มา - Wiz
ไมโครซอฟท์ประกาศเพิ่มโมเดลปัญญาประดิษฐ์ R1 ของ DeepSeek ให้เลือกใช้งานผ่านแพลตฟอร์ม Azure AI Foundry และบน GitHub ตั้งแต่วันนี้เป็นต้นไป ซึ่งปัจจุบันแพลตฟอร์มมีโมเดลปัญญาประดิษฐ์ให้เลือกใช้งานมากกว่า 1,800 โมเดล
Asha Sharma รองประธานฝ่ายแพลตฟอร์ม AI ของไมโครซอฟท์บอกว่า จุดเด่นสำคัญของ R1 คือความเร็ว นักพัฒนาสามารถนำโมเดลนี้มาใช้กับเวิร์กโฟลว์ที่ต้องการ แล้วทดสอบเทียบกับโมเดลอื่นที่ใช้งานอยู่ได้ ส่วนความเสี่ยงด้านอื่นนั้น ไมโครซอฟท์ได้ประเมินการทำงานที่ครอบคลุม เพื่อลดความเสี่ยงแล้ว
ไมโครซอฟท์ยังมีแผนนำ DeepSeek R1 ให้เลือกรันโลคอลบนคอมพิวเตอร์ที่เป็น Copilot+ PC ได้เร็ว ๆ นี้
ข่าว DeepSeek ประจำวันนี้ หน่วยงานกำกับดูแลการป้องกันข้อมูลของอิตาลีหรือ Garante ได้สั่งให้ App Store ของแอปเปิล และ Play Store ของกูเกิล ถอดแอป DeepSeek ออกจากสโตร์ชั่วคราว ทำให้ตอนนี้ผู้ใช้งานในอิตาลีไม่สามารถดาวน์โหลดแอปได้
Garante บอกว่าทางหน่วยงานมีความกังวลเรื่องการจัดเก็บข้อมูลและปกป้องความเป็นส่วนตัวผู้ใช้งานของ DeepSeek จึงได้ส่งคำถามหลายข้อไปยังผู้พัฒนาเพื่อให้ตอบรายละเอียดกลับมาภายใน 20 วัน ทางการจะตรวจสอบเพิ่มเติมด้วยว่า DeepSeek ปฏิบัติตามกฎหมายการปกป้องข้อมูลส่วนตัว GDPR ของสหภาพยุโรปหรือไม่
Mark Chen (Chief Research Officer ของ OpenAI) แสดงความคิดเห็นผ่านทาง X (Twitter) ว่าขอแสดงความยินดีกับทีม DeepSeek ที่สามารถพัฒนาโมเดล LLM ให้มีความสามารถด้าน Reasoning เทียบเท่ากับ OpenAI o1 ได้
Chen กล่าวชื่นชมว่าทีมพัฒนา DeepSeek สามารถค้นพบแนวคิดหลักบางส่วนที่ทีม OpenAI ใช้ในการพัฒนา o1 ได้ด้วยตนเอง โดยระบุว่า " ...they've independently found some of the core ideas that we did on our way to o1 "
[ไม่ยืนยัน] Microsoft และ OpenAI กำลังสอบสวนเหตุการณ์ดึงข้อมูลจำนวนมากจากระบบ อาจเกี่ยวข้อง DeepSeek
Bloomberg อ้างแหล่งข่าวที่เกี่ยวข้องเปิดเผยว่า Microsoft และ OpenAI กำลังสอบสวนว่าข้อมูลที่สร้างจากเทคโนโลยีของ OpenAI ถูกนำไปใช้งานอย่างไม่ถูกต้อง โดยกลุ่มพัฒนาปัญญาประดิษฐ์ของจีนซึ่งอาจมีความเกี่ยวข้องกับ DeepSeek
เรื่องเริ่มจากทีมงานวิจัยด้านความปลอดภัยของไมโครซอฟท์ได้ตรวจสอบ พบว่ามีการดึงข้อมูลจำนวนมากออกไปผ่าน API ของ OpenAI อย่างไม่ถูกต้อง ทางไมโครซอฟท์จึงแจ้งปัญหานี้ไปที่ OpenAI ให้ตรวจสอบเพิ่มเติมในกิจกรรมที่น่าสงสัยนี้ต่อไป
Microsoft, OpenAI และ DeepSeek ยังไม่ได้ออกมาให้ความเห็นต่อรายงานนี้
ที่มา: Bloomberg
Pat Gelsinger อดีตซีอีโออินเทล แสดงความเห็นในคืนวันจันทร์ที่ตลาดหุ้นสหรัฐกำลังแตกตื่นกับข่าว DeepSeek จนทำให้หุ้นเทคราคาปรับลดลงมาก โดยเฉพาะ NVIDIA ที่ลดลงวันเดียวถึง 17% โดยเขามองว่าตลาดหุ้นกำลังเข้าใจสถานการณ์ผิด
Gelsinger บอกว่ากรณีของ DeepSeek เป็นการย้ำเตือนในกฎ 3 ข้อ ซึ่งพวกเราต่างรู้กันอยู่แล้วคือ
กองทัพเรือสหรัฐออกประกาศเตือนให้เจ้าหน้าที่หลีกเลี่ยงการใช้งาน DeepSeek ไม่ว่าในกรณีใด ๆ ไม่ว่าจะเป็นเรื่องงานหรือเรื่องส่วนตัว โดยให้เหตุผลเรื่องความปลอดภัยและปัญญาจริยธรรมของต้นกำเนิดในการพัฒนาโมเดลนี้
ตัวแทนของกองทัพเรือสหรัฐบอกว่าประกาศนี้เป็นไปตามกฎการใช้งาน Generative AI ของหน่วยงานซึ่งกำหนดโดยฝ่ายสารสนเทศของกองทัพฯ
จนถึงตอนนี้การสมัครเปิดบัญชีใช้งาน DeepSeek ยังไม่ราบรื่นดี ข้อความเตือน ว่าระบบยังมีปัญหาการถูกโจมตียังคงอยู่
ที่มา: CNBC
ทีมวิจัยจาก Hugging Face ประกาศโครงการ Open-R1 พยายามฝึกโมเดลใหม่ที่เทียบเท่ากับ DeepSeek-R1 แต่มีชุดข้อมูลเปิดให้คนอื่นไปทำซ้ำได้
หลักการของ DeepSeek-R1 ในแกนกลางนั้นตรงไปตรงมา คือผู้ฝึกมีชุดข้อมูลการให้เหตุผลในการแก้ปัญหาไว้ล่วงหน้า จากนั้นพยายามฝึกโมเดล LLM ปกติสักตัว โดยให้รางวัลการให้เหตุผลแบบ reinforcement learning (RL) แบบเดียวกับการให้รางวัล AI เล่นเกมที่ให้รางวัลเมื่อเล่นชนะ
แม้ DeepSeek-R1 จะเปิดโค้ดสำหรับรันโมเดล แต่ก็ไม่ได้เปิดเผยชุดข้อมูลเอาไว้ รวมถึงไม่ได้เปิดโค้ดสำหรับการฝึกโมเดล การศึกษาโมเดลจึงทำได้เฉพาะในแง่การใช้งานเท่านั้น การสร้างชุดข้อมูลเปิดพร้อมกับโค้ดฝึกให้ทุกคนใช้งานจะเปิดให้มีการพัฒนาโมเดลแบบนี้กว้างขึ้นมาก
Satya Nadella ซีอีโอ Microsoft ออกมาแสดงความเห็นเชิงบวกเกี่ยวกับ DeepSeek โดยอ้างอิงทฤษฎีพาราด็อกซ์ของเจวอนส์ (Jevons Paradox) ว่า เมื่อ AI มีประสิทธิภาพสูงขึ้น และสามารถเข้าถึงได้ง่ายขึ้น การใช้งาน AI ก็จะพุ่งสูงขึ้นตาม และกลายเป็นสิ่งสำคัญเพื่อใช้ในการดำรงชีวิตมาก เหมือนปัจจัยที่ 5
Nadella เชื่อว่า AI ที่มีประสิทธิภาพอย่าง R1 ของ DeepSeek จะขับเคลื่อนความต้องการที่เพิ่มมากขึ้น และพัฒนาเทคโนโลยีให้ก้าวหน้า แต่ก็อาจทำให้ต้องใช้ทรัพยากรมากขึ้น ซึ่งอาจไม่ยั่งยืนในเชิงเศรษฐกิจ
DeepSeek กลายเป็นกระแสมาแรงในนาทีนี้ของโลกปัญญาประดิษฐ์ ทำให้ใครก็อยากทดลองใช้งานเพื่อเปรียบเทียบกับเครื่องมือ AI ที่ใช้ประจำ ซึ่งทำให้ DeepSeek ต้องประกาศจำกัดการลงทะเบียนสร้างบัญชีใช้งานในช่วงนี้
ก่อนหน้านี้ DeepSeek ขึ้นข้อความในหน้าสมัครใช้งานว่าระงับชั่วคราว เนื่องจากแพลตฟอร์มถูกรบกวนจากการโจมตีขนาดใหญ่ ในบางช่วงการลงทะเบียนต้องใช้เบอร์โทรศัพท์ในจีนเท่านั้น แต่ล่าสุดข้อความบอกว่าการโจมตียังมีอยู่ ระบบลงทะเบียนอาจใช้งานไม่ได้ในบางช่วง ให้ผู้สนใจรอและทดลองสมัครอีกครั้ง ส่วนคนที่มีบัญชีอยู่แล้วสามารถล็อกอินได้ตามปกติ ขอบพระคุณที่เข้าใจและให้การสนับสนุน
DeepSeek เปิดตัวโมเดล AI รองรับสื่อผสมผสานหรือ Multimodal ชื่อว่า Janus-Proมีขนาดพารามิเตอร์ 1B และ 7B พร้อมความสามารถในการวิเคราะห์และสร้างรูปภาพขึ้นใหม่ตามที่กำหนดได้
ผลการทดสอบด้วยชุดทดสอบ GenEval และ DPG-Bench พบว่า Janus-Pro-7B ทำคะแนนได้สูงกว่า DALL-E 3 ของ OpenAI ตลอดจนโมเดลสร้างรูปภาพอื่นอย่าง PixArt-alpha, Emu3-Gen และ Stable Diffusion XL ของ Stability AI
โมเดลสามารถ ดาวน์โหลดได้ที่ GitHub ภายใต้เงื่อนไขใช้งาน MIT จึงสามารถใช้งานในเชิงพาณิชย์ได้
ที่มา: TechCrunch
Sam Altman ซีอีโอ OpenAI ออกมาแสดงความเห็นเกี่ยวกับบริษัทปัญญาประดิษฐ์จากจีน DeepSeek แล้วเช่นกัน โดยเขาบอกว่า โมเดล R1 นั้น "น่าประทับใจ" (impressive) โดยเฉพาะเรื่องต้นทุนในการพัฒนาที่ต่ำ
เขาเสริมว่า OpenAI ยังคงเดินหน้าพัฒนาโมเดล AI ที่ดีกว่านี้ขึ้นไปอีก การมีคู่แข่งหน้าใหม่เข้ามาก็เป็นเรื่องที่น่าตื่นเต้น ขอให้ติดตามโมเดลใหม่ ๆ กันต่อไป
ประเด็นสำคัญที่ถกเถียงกันมากตอนนี้คือการพัฒนาโมเดล AI รุ่นใหม่ยังต้องใช้ทรัพยากรประมวลผลขั้นสูงอีกหรือไม่ Altman เสริมว่า OpenAI ยังคงเดินหน้าแผนวิจัยพัฒนาต่อไปตามเดิม ซึ่งการไปถึงจุดนั้นทรัพยากรประมวลผลจะมีความสำคัญมากขึ้นไปอีก เพื่อให้ไปถึงเป้าหมาย สิ่งที่จะเกิดขึ้นจากนี้ในโลกคือความต้องการ AI ที่มากขึ้นมาก
NVIDIA ชี้แจงกับสื่อหลัง ราคาหุ้นปรับลดลงแรง 17% จากความกังวลว่า DeepSeek ได้นำเสนอเทคโนโลยีการพัฒนาปัญญาประดิษฐ์ที่ไม่ต้องพึ่งพาฮาร์ดแวร์ประสิทธิภาพสูง จึงอาจเข้าสู่จุดพีคของความต้องการจีพียู
NVIDIA บอกว่าเทคโนโลยี DeepSeek ทำให้เห็นว่าเราสามารถสร้างโมเดลใหม่ขึ้นมาได้ โดยใช้เทคนิคหลายอย่าง รวมทั้งต่อยอดจากโมเดลโอเพนซอร์สที่มีอยู่ ร่วมกับการประมวลผลที่ถูกควบคุมไว้อย่างดี ซึ่งเป็นความก้าวหน้าในการทำส่วน Test-Time Scaling ตามกฎการ Scaling 3 อย่าง (Three Scaling Laws) ที่ซีอีโอ Jensen Huang เคยอธิบายไว้
ตลาดหุ้นสหรัฐอเมริกาเมื่อคืนนี้สะท้อนความกังวลจาก DeepSeek บริษัทปัญญาประดิษฐ์ของจีน ที่เผยแพร่ โมเดลโอเพนซอร์ส R1 มีความสามารถบางอย่างเหนือกว่า o1 ของ OpenAI แต่ใช้ต้นทุนการพัฒนาที่ต่ำกว่ามาก และไม่ต้องใช้เทคโนโลยีชิปรุ่นล่าสุด โดยราคาหุ้นกลุ่มเทคจำนวนมากปรับลดลงสูง
NVIDIA ซึ่งเป็นศูนย์กลางของความกังวลนี้ ราคาหุ้นลดลงถึง 16.97% ปิดการซื้อขายที่ 118.42 ดอลลาร์ต่อหุ้น มูลค่ากิจการหายไปในวันเดียวกว่า 6 แสนล้านดอลลาร์ หรือประมาณ 20 ล้านล้านบาท เป็นสถิติสูงสุดที่เคยมีมาในตลาดหุ้นสหรัฐ โดยประเด็นหลักคือความต้องการจีพียูสมรรถนะสูงอาจไม่ใช่เรื่องสำคัญแล้ว จึงอาจกระทบกับรายได้ในอนาคตของ NVIDIA
The Information อ้างแหล่งข่าวภายใน Meta บอกว่าได้มีการเรียกประชุมหัวหน้าและวิศวกร ส่วนที่ดูแล Generative AI และ Infrastructure เป็นการเร่งด่วน โดยตั้งวอร์รูม (War Room) เป็น 4 ทีม เพื่อประเมินการทำงานและผลกระทบที่เกิดขึ้นจาก DeepSeek
โดยมี 2 ทีม โฟกัสที่การทำงานของ DeepSeek ว่าใช้วิธีอย่างไรทำให้ต้นทุนการฝึกฝนต่ำมาก รวมทั้งใช้ทรัพยากรน้อยในการรันโมเดล อีกทีมทำการศึกษาว่า DeepSeek ใช้ข้อมูลจากแหล่งใดในการฝึกฝน AI และทีมสุดท้ายพิจารณาว่า Meta สามารถนำวิธีการใหม่ ๆ จาก DeepSeek มาปรับใช้ในการพัฒนาโมเดลของบริษัทอย่างไรได้บ้าง
ประเด็นร้อนแรงของวงการเทคตอนนี้คงไม่พ้น DeepSeek บริษัทปัญญาประดิษฐ์จากจีนที่ออกโมเดล R1 มีความสามารถคิดเป็นขั้นตอน และมี ผลทดสอบหลายด้านชนะ o1 ของ OpenAI พร้อมจุดเด่นคือต้นทุนการฝึกที่ต่ำกว่ามาก แถมยังโอเพนซอร์ส เรื่องนี้จึงอาจนำมาสู่การเปลี่ยนแปลงหลายอย่างในการพัฒนา AI ซึ่งไม่ใช่แค่จากจีนแต่อาจส่งผลทั้งวงการได้
กระแสมาแรงของ DeepSeek ดูจะสร้างความกังวลให้กับนักลงทุนบ้างแล้ว โดยวันนี้ราคาหุ้นของบริษัทที่เกี่ยวข้องกับธุรกิจชิปในญี่ปุ่น เช่น Advantest ที่ผลิตเครื่องจักรทดสอบให้ NVIDIA ลดลง 8% ส่วน Disco Corporation ที่ผลิตเครื่องมือสำหรับบริษัทผลิตชิปลดลง 2%
SoftBank ที่ประกาศร่วมลงทุนในโครงการ Stargate สร้างศูนย์ข้อมูล AI ในสหรัฐอเมริกา ราคาหุ้นลดลง 8% และ Furukawa Electric ที่ผลิตสายเคเบิ้ลในศูนย์ข้อมูลลดลง 11%
DeepSeek บริษัทปัญญาประดิษฐ์ของจีนที่เพิ่งเปิดตัวโมเดลคิดเป็นขั้นตอน R1 เมื่อสัปดาห์ที่แล้ว กลายเป็นหัวข้อสนทนาหลักในวงการ AI ถึงความก้าวหน้าครั้งใหญ่ เพราะโมเดลมีขนาดเล็กที่สุด 1.5B แต่ความสามารถหลายด้านสูงกว่า OpenAI o1-mini ขณะที่ต้นทุนในการฝึกฝนโมเดลนั้นต่ำมาก โดยบริษัทบอกว่าใช้เงิน 5.6 ล้านดอลลาร์เท่านั้น
กระแสข่าวที่ออกมาทำให้ DeepSeek ตอนนี้ขึ้นอันดับ 1 แอปยอดนิยมของ App Store ในสหรัฐอเมริกา แซงหน้า ChatGPT ไปเรียบร้อย