Large Language Model

Tags:
Node Thumbnail

Anthropic เปิดตัวความสามารถใหม่สำหรับ API ของนักพัฒนาเรียกชื่อว่า Citationsเพื่อให้คำตอบที่ได้ สามารถตรวจสอบย้อนกลับไปต้นทางได้ว่ามีที่มาอย่างไร เพิ่มความน่าเชื่อถือและลดความผิดเพี้ยน

ในการใช้งาน Citations ผู้ใช้งานจะอัปโหลดเอกสารอ้างอิง จากนั้นโมเดล Claude จะแยกประโยคเป็นส่วน ๆ เพื่อให้ถูกลิงก์กลับมาเมื่อมีการให้คำตอบในประเด็นนั้น ผลการทดสอบภายในของ Anthropic พบว่าการอ้างอิงทำให้คำตอบมีความแม่นยำมากขึ้น 15%

Tags:
Node Thumbnail

ByteDance เปิดตัว Doubao-1.5-pro โมเดลปัญญาประดิษฐ์ LLM เรือธงของบริษัท โดยระบุว่าผลการทดสอบในบางหัวข้อ เช่น ความรู้ MMLU, โค้ด McEval หรือการให้เหตุผล DROP ทำได้เหนือกว่าโมเดลรุ่นบนของค่ายอื่นทั้ง Llama3.1-405B หรือ GPT4o-0806

การเปิดตัวโมเดลปัญญาประดิษฐ์รุ่นใหม่ของ ByteDance นี้ ทำให้เห็นถึงการแข่งขันด้าน AI จากบริษัทจีน โดยเมื่อต้นสัปดาห์ DeepSeek ก็เปิดตัว DeepSeek-R1 ซึ่งทำงานด้วยการคิดเป็นขั้นตอน และมีผลทดสอบบางชุดดีกว่า o1 ของ OpenAI

Tags:
Node Thumbnail

DeepSeek บริษัทปัญญาประดิษฐ์จากจีนเปิดตัวโมเดล DeepSeek-R1 โมเดล LLM แบบคิดหาเหตุผลก่อนตอบ (reasoning model) โดยแบ่งเป็นสองรุ่นย่อย คือ

Tags:
Topics: 
Node Thumbnail

Sam Altman ซีอีโอ OpenAI เปิดเผยว่าบริษัทได้เข้าสู่การพัฒนาเวอร์ชันสุดท้ายของโมเดลคิดเป็นเหตุเป็นผล o3-mini แล้ว ซึ่งจะปล่อยออกมาให้ใช้งานในอีกไม่กี่สัปดาห์ข้างหน้า

OpenAI เปิดตัวโมเดลใหม่ o3 และ o3-mini เมื่อเดือนธันวาคมปีที่แล้ว มีความสามารถทำข้อสอบ ARC-AGI ที่ต้องใช้ความเข้าใจกฎของแต่ละข้อได้คะแนนสูงกว่ามนุษย์ทั่วไป ซึ่งตอนนั้น OpenAI บอกว่าทั้งสองโมเดลยังอยู่ในขั้นตอนการทดสอบความปลอดภัย คาดว่า o3-mini จะเผยแพร่ออกมาได้ก่อน

Altman บอกว่าทั้ง API และการทำงานบน ChatGPT จะรองรับพร้อมกันกับการเผยแพร่โมเดล o3-mini นี้ด้วย

Tags:
Node Thumbnail

Cerebras ผู้ผลิตชิปปัญญาประดิษฐ์รัน LLM ความเร็วสูงที่ สามารถรัน Llama 3.1 405B ได้ความเร็วถึง 969 token/s เปิดเผยถึงแนวทางการออกแบบชิปที่ทำให้สามารถให้บริการได้เร็วระดับนี้ ว่าอาศัยการสร้างชิปขนาดใหญ่ที่มีคอร์จำนวนมหาศาลอยู่ภายใน

Tags:
Node Thumbnail

แอปเปิลได้ออกอัปเดต iOS 18.3 เบต้า 3 ซึ่งเป็นเวอร์ชันทดสอบให้กับนักพัฒนา โดยมีการเปลี่ยนแปลงสำคัญของ Apple Intelligence ส่วนปัญญาประดิษฐ์สรุปข้อความแจ้งเตือนหรือ Notification Summary

ก่อนหน้านี้ฟังก์ชัน Notification Summary ถูกรายงานปัญหาการสรุปข้อความที่ผิดเพี้ยนไปจากสาระสำคัญ โดยสำนักข่าว BBC ยกตัวอย่างหลายกรณี ทำให้ แอปเปิลออกมายอมรับ ในความผิดพลาดและบอกว่าจะแก้ไข

แอปเปิลอธิบายรายละเอียดที่ปรับปรุงใน iOS 18.3 ดังนี้

Tags:
Node Thumbnail

Together.AI บริการคลาวด์ LLM เปิด Llama 3.3 70B ให้ใช้งานได้ฟรีในระดับ free tier ที่จำกัดปริมาณการใช้งาน

โมเดลนี้รันบน Together Turbo และใช้โมเดลแบบ FB8 ที่ยังคงความเร็วโดยไม่เสียคุณภาพมากนัก (โมเดลเดิมพารามิเตอร์เป็น BF16)

ผู้ใช้งานฟรีจะมี rate limit ที่ 60RPM และ 60,000 TPM (token per minute) การใช้งานแชตทั่วไปน่าจะเพียงพอ แต่หากเป็นการใช้งานเอกสารขนาดใหญ่ หรือต้องการทำบริการ agentic ที่พรอมพ์มักจะยาวมากๆ ก็น่าจะต้องระวังเกินโควต้า

ที่มา - Together.AI

Tags:
Node Thumbnail

Red Hat รายงานว่าบริษัทได้ซื้อกิจการ Neural Magic สตาร์ทอัปด้าน AI เสร็จสิ้นแล้ว หลังจากบริษัทประกาศแผนซื้อกิจการเมื่อเดือนพฤศจิกายนปีที่แล้ว ดีลนี้ไม่มีการเปิดเผยมูลค่า โดยก่อนหน้านี้ Neural Magic ได้รับเงินจากนักลงทุนรวม 50 ล้านดอลลาร์ และดีลนี้อาจเรียกว่าคนคุ้นเคยก็ได้ เพราะซีอีโอ Neural Magic คือ Brian Stevens อดีตผู้บริหาร Red Hat

Neural Magic เป็นบริษัทพัฒนาซอฟต์แวร์ซึ่งอยู่บนแนวคิดว่า อนาคตของปัญญาประดิษฐ์ต้องเป็นแบบเปิด โมเดลจึงควรสามารถเข้าถึงได้ในทุกระดับ และประมวลผลได้บนฮาร์ดแวร์ที่หลากหลาย ซอฟต์แวร์ของ Neural Magic มีความสามารถปรับแต่งให้โมเดลปัญญาประดิษฐ์ที่ซับซ้อน ก็สามารถทำงานได้บนฮาร์ดแวร์ที่ไม่ได้มีสเป็กสูง

Tags:
Topics: 
Node Thumbnail

Alibaba Cloud เปิดบริการ Qwen Chat แบบเดียวกับ ChatGPT ให้ลูกค้าบุคคลทั่วไปใช้งาน จากเดิม Qwen เปิดให้บริการ API บน Alibaba Cloud สำหรับลูกค้าองค์กรเป็นหลัก

Qwen Chat ให้บริการทั้งโมเดล Qwen เวอร์ชั่นโอเพนซอร์สและเวอร์ชั่นปิดที่เคยต้องเรียกผ่าน API เท่านั้น รวมถึงโมเดลแบบคิดก่อนตอบอย่าง QwQ และ QVQ ด้วย

หน้าจอใช้ OpenWebUI แบบเดียวกับที่จุฬาลงกรณ์มหาวิทยาลัยใช้งาน ทำให้มีฟีเจอร์ตามมาหลายตัว เช่น การเปรียบเทียบโมเดลรุ่นต่างๆ ตอนนี้ยังไม่มีเงื่อนไขค่าบริการแต่อย่างใด

ที่มา - @Alibaba_Qwen

Tags:
Node Thumbnail

กูเกิลยังคงเพิ่มฟีเจอร์คอนเทนต์เสียงที่สร้างด้วย AI ให้กับผู้ใช้งาน โดยล่าสุดเพิ่มโครงการทดลอง "Daily Listen" ที่นำเนื้อหาในฟีดข่าวมาแปลงเป็นรายการพอดคาสต์สรุปเนื้อหาให้

ไอเดียนี้เป็นการพัฒนาจากฟีเจอร์ที่เป็นกระแสก่อนหน้านี้ NotebookLM ที่สร้างรายการเสียงพอดคาสต์ขึ้นจากไฟล์เอกสาร

รายการ Daily Listen ที่สรุปเนื้อหาข่าวในฟีดผู้ใช้งานแต่ละคน ถูกสร้างด้วยความยาวประมาณ 5 นาที แสดงเป็นไอคอนในหน้าแรกของแอป Google ให้กดฟัง

ฟีเจอร์นี้ยังจำกัดให้เฉพาะผู้ใช้งานในสหรัฐอเมริกา ใช้งานได้ผ่านแอป Google ทั้ง Android และ iOS โดยต้องเปิดการทำงานใน Labs ที่มุมบนซ้ายของแอปก่อน

Tags:
Node Thumbnail

ไมโครซอฟท์โอเพนซอร์สโมเดลปัญญาประดิษฐ์ Phi-4 ผ่าน Hugging Face แล้ว ตามที่เคยประกาศไว้ ภายใต้สัญญาอนุญาตแบบ MIT

ไมโครซอฟท์ เปิดตัว Phi-4 ที่เป็นโมเดลภาษาขนาดเล็ก (Small Language Model) 14B พารามิเตอร์ เมื่อเดือนที่แล้ว โดยจำกัดให้ใช้งานผ่าน Azure AI Foundry การโอเพนซอร์สโมเดลนี้พร้อมสัญญาอนุญาตแบบ MIT ที่สามารถนำไปใช้งานต่อในเชิงพาณิชย์ได้ น่าจะเพิ่มทางเลือกให้กับพัฒนาได้

Phi-4 มีผลทดสอบที่โดดเด่น โดยเฉพาะการแก้ปัญหาคณิตศาสตร์ หรือหัวข้อเฉพาะทาง รวมทั้งมีคะแนนที่สูงกว่าโมเดลขนาดใหญ่กว่าอย่าง Gemini Pro 1.5 ในบางหัวข้อด้วย

Tags:
Node Thumbnail

ตำรวจลาสเวกัสแถลงข่าวผลการสอบสวน เหตุการณ์ที่คนร้ายวางระเบิดรถกระบะไฟฟ้า Tesla Cybertruck หน้าโรงแรม Trump Hotel ซึ่งคนร้ายที่เป็นคนขับรถเสียชีวิต และมีผู้บาดเจ็บอีกหลายคน โดยบอกว่าคนร้ายใช้ ChatGPT ช่วยวางแผนก่อเหตุครั้งนี้

Tags:
Node Thumbnail

แอปเปิลออกแถลงการณ์ชี้แจงสำนักข่าว BBC เกี่ยวกับฟีเจอร์สรุปข้อความในการแจ้งเตือน Notification Summary ของ Apple Intelligence ที่สรุปเนื้อหาผิดพลาดไม่ตรงกับเนื้อหาจริง

แอปเปิลเพิ่มปัญญาประดิษฐ์ Apple Intelligence มาตั้งแต่ iOS 18.1 ซึ่งหนึ่งในความสามารถที่มีคือการสรุปข้อความแจ้งเตือนหรือ Notification Summary เพื่อลดเวลาที่ผู้ใช้งานต้องไล่อ่านทุกข้อความเตือน รวบสรุปไว้ในบรรทัดเดียว ซึ่งแอปที่แอปเปิลยกตัวอย่างว่ามีประโยชน์สำหรับฟังก์ชันนี้เช่น Messages หรือแอปข่าวต่าง ๆ นั่นเอง

Tags:
Node Thumbnail

NVIDIA เปิดตัวคอมพิวเตอร์ Project DIGITS ที่ภายในเป็นชิป GB10 Superchip สถาปัตยกรรม Grace Blackwell ชูจุดขายว่าเราทุกคนสามารถรันโมเดลขนาด 200B ด้วยตัวเอง

GB10 เป็นซีพียู NVIDIA Grace 20 คอร์ แรม 128GB รวมกันระหว่างซีพียูและจีพียู สตอเรจ NVMe 4TB ทำให้หากรันโมเดลย่อแบบ FP4 ก็จะรันโมเดลขนาดใหญ่ 200B ได้ในตัว แถมรองรับเน็ตเวิร์ค ConnectX เชื่อม DIGITS สองตัวเข้าด้วยกัน รันโมเดล 405B ได้

Project DIGITS เริ่มวางขายเดือนพฤษภาคมนี้ ราคาเริ่มต้น 3,000 ดอลลาร์หรือประมาณหนึ่งแสนบาท

ที่มา - NVIDIA

Tags:
Node Thumbnail

Anthropic เปิดเผยว่าโมเดล AI Claude จะหยุดให้ข้อมูลเนื้อเพลง ที่มีลิขสิทธิ์ของค่ายเพลง หรือสร้างเนื้อเพลงใหม่ที่อิงจากเพลงที่มีลิขสิทธิ์ หลังจากสามค่ายเพลงใหญ่ฟ้อง Anthropic ที่นำเนื้อเพลงลิขสิทธิ์ไปเทรน AI อย่างไรก็ตามคดีความที่ยังฟ้องร้องกันนั้นยังคงดำเนินต่อไป

ในแถลงการณ์ Anthropic บอกว่าบริษัทไม่ได้สร้าง Claude ให้ละเมิดลิขสิทธิ์ ในการพัฒนามีขั้นตอนหลายอย่างเพื่อป้องกันอยู่แล้ว การตัดสินใจหยุดให้ข้อมูลนี้ก็เพื่อแสดงให้เห็นว่าบริษัทให้ความสำคัญกับเรื่องเนื้อหาที่อาจละเมิดลิขสิทธิ์

Tags:
Node Thumbnail

SCB10X ประกาศปล่อยโมเดลปัญญาประดิษฐ์ LLM โดยรองรับหลายรูปแบบทั้งแบบขัอความปกติ, แบบรับภาพ, และแบบรับ/ตอบเป็นเสียง

ตัวโมเดลทั้งหมดพัฒนาต่อมาจากโมเดลโอเพนซอร์ส Llama-3.1/3.2, Qwen2.5 พร้อมกับโมเดลความปลอดภัย Typhoon2-Safety ที่พัฒนามาจาก mdeberta-v3-base โดยจุดสำคัญคือการสร้างชุดข้อมูลที่สะท้อนวัฒนธรรมไทย ทีมงานสร้างโมเดลปัญญาประดิษฐ์มาจัดคะแนนข้อมูลว่าเกี่ยวข้องกับประเทศไทยหรือไม่ โดยให้คะแนน 1-5 ชุดข้อมูลที่ได้คะแนนเกินเกณฑ์ในหมวดต่างๆ ก็จะถูกนำมาใช้งาน ข้อมูลอีกส่วนหนึ่งยังเป็นการสร้างจาก LLM ที่อ่านข้อความแล้วเขียนเป็นภาษาไทยในสไตล์ หนังสือเรียน, บล็อก, หรือบทความวิชาการ

Tags:
Topics: 
Node Thumbnail

Alibaba Cloud ประกาศลดราคาค่าใช้งาน โมเดลปัญญาประดิษฐ์ ที่รับอินพุทเป็นรูปภาพและวิดีโอ Qwen-vl-max ลง 85% โดยราคาอยู่ที่ 0.003 หยวนต่อ 1,000 อินพุทโทเค็น

การลดราคานี้เพื่อให้โมเดลทำความเข้าใจรูปภาพของ Alibaba Cloud สามารถแข่งขันด้านราคากับโมเดลประเภทเดียวกันของ ByteDance ได้ ซึ่งคิดราคาที่ 0.003 หยวน เท่ากัน

ประกาศนี้สะท้อนว่าการแข่งขันเรื่องโมเดลปัญญาประดิษฐ์ของผู้ให้บริการในจีนมีเพิ่มมากขึ้น ปัจจุบันการให้บริการโมเดลปัญญาประดิษฐ์ในจีน ต้องได้รับการอนุมัติจากหน่วยงานก่อน ซึ่งตอนนี้มีโมเดล Generative AI ที่ถูกอนุมัติแล้ว 252 โมเดล ผู้ให้บริการจึงเริ่มใช้การลดราคา มาดึงดูดให้เกิดการเลือกใช้งาน

Tags:
Node Thumbnail

DeepSeek v3 โมเดลปัญญาประดิษฐ์ LLM ที่เปิดให้ดาวน์โหลดไปใช้งานเองที่ใหญ่ที่สุดในตอนนี้ รวม 685B ออกรายงานเชิงเทคนิค เปิดเผยถึงสถาปัตยกรรมและกระบวนการฝึก

เซิร์ฟเวอร์ที่ใช่งานเป็นคลัสเตอร์ NVIDIA H800 รุ่นขายในจีนโดยเฉพาะ ซอฟต์แวร์เป็น HAI-LLM ของบริษัท High Flyer (ตัว DeekSeek ได้ทุนจาก High Flyer Capital Management) รายงานระบุว่า DeepSeek พยายามใช้ช่องทางการสื่อสารระหว่างชิปอย่างเต็มประสิทธิภาพ โดยชิป H800 ถูกบีบแบนวิดท์ระหว่างชิปเหลือ 300Gbps เทียบกับ H100 ที่ส่งข้อมูลได้ 600Gbps กระบวนการฝึกทั้งหดใช้เวลา 2.788 ล้านชั่วโมง

Tags:
Node Thumbnail

บริการ Meta AI ที่เป็นแชตบอตสำหรับผู้ใช้ทั่วไป เปิดให้ใช้งานในประเทศไทยแล้ว หลังจากก่อนหน้านี้จำกัดประเทศผู้ใช้งาน

Meta AI ใช้ Llama 3 เป็นฐานในการให้บริการ โดยผู้ใช้ในไทยสามารถใช้งานได้ครบถ้วน ทั้งการสสร้างภาพ หรือแม้แต่แปลงภาพให้กลายเป็นภาพเคลื่อนไหวก็ยังได้

ที่มา - Meta AI

Tags:
Node Thumbnail

DeepSeek ผู้พัฒนาปัญญาประดิษฐ์ LLM จากจีน ปล่อยโมเดล DeepSeek v3 โมเดล LLM ขนาดใหญ่มาก จำนวนพารามิเตอร์มากขึ้น 685B จากเดิมที่โมเดลเปิดใหญ่สุดคือ Llama 3.1 405B

ตอนนี้ยังไม่มีข้อมูลเกี่ยวกับโมเดลนี้นัก แต่ทาง Aider โครงการซอฟต์แวร์ช่วยเขียนโปรแกรมก็โชว์ผลทดสอบพบว่า DeepSeek v3 ทำคะแนนทดสอบได้ดีมาก แซงหน้า Claude 3.5 Sonnet อละ Gemini Exp 1206 ไปได้ เป็นรองเพียง OpenAI o1 เท่านั้น ตัวโมเดลใช้สถาปัตยกรรม Mixture-of-Experts แยก expert ออก 256 ชุด และเลือกใช้ 8 ชุดในแต่ละ token

Tags:
Topics: 
Node Thumbnail

ทีม Qwen ของ Alibaba Cloud เปิดโมเดล QvQ-72B-Preview ที่พัฒนาต่อจาก Qwen-VL-72B แต่ฝึกให้คิดเป็นขั้นเป็นตอนเพื่อเพิ่มความแม่นยำมากขึ้น

ผลทดสอบที่ทีม Qwen ใช้ทดสอบมี 4 ชุด ได้แก่ MMMU, MathVista, MathVision, และ OlympiadBench คะแนนที่ได้ขึ้นไปถึงระดับ Claude 3.5 Sonnet เข้าใกล้ OpenAI o1 มากขึ้น โดยพฤติกรรมของโมเดลจะคิดไปเรื่อยๆ และตอบคำถามสุดท้าย

โมเดลเปิดให้ทดสอบผ่าน HuggingFace ไฟล์โมเดลเปิดให้ดาวน์โหลดในไลเซนส์แบบ Qwen License โดยตอนนี้ยังส่งคำสั่งได้รอบเดียว ไม่สามารถคุยต่อเนื่องได้

ที่มา - QwenLM

Tags:
Node Thumbnail

Together.AI ผู้ให้บริการคลาวด์ปัญญาประดิษฐ์เปิดบริการปรับแต่งโมเดล (finetune) แบบ LoRA เต็มรูปแบบ โดยทั้งการฝึกโมเดลและการรันโมเดลที่ปรับแต่งมาแล้ว

บริการ Severless LoRA สามารถใช้ adapter ที่ปรับแต่งมาแล้วจากที่อื่นได้ โดยคิดค่ารันตามโทเค็นเท่ากับโมเดลหลักเท่านั้น และสามารถใช้งานได้กับทุกโมเดลที่ทาง Together.AI ให้บริการแบบ serverless อยู่ เช่น Llama และ Qwen

ส่วนการทำ finetune บน Together.AI ก็สามารถอัพโหลดชุดข้อมูลขึ้นไปฝึกแบบ LoRA ได้ โดยคิดค่าบริการตามขนาดข้อมูลและจำนวนรอบการฝึก หลักฝึกฝึกเสร็จแล้ว โมเดลจะนำไปรันได้ทันทีหรือจะดาวน์โหลด adapter ไปใช้งานที่อื่นก็ได้เช่นกัน

Tags:
Node Thumbnail

The Wall Street Journal มีรายงานโดยอ้างแหล่งข่าวที่เกี่ยวข้อง ถึงปัญหาและอุปสรรค์ของการพัฒนา GPT-5 โมเดลแชทบอตปัญญาประดิษฐ์เวอร์ชันใหม่ของ OpenAI หรือที่มี โค้ดเนมภายในว่า Orion ซึ่งพัฒนามานาน 18 เดือนแล้ว

OpenAI ได้เทรนข้อมูลครั้งใหญ่สำหรับ Orion แล้วสองครั้ง โดยมีเป้าหมายให้ Orion เป็นปัญญาประดิษฐ์ที่ฉลาดรอบรู้มากขึ้น แต่ปัญหาที่พบว่าคือความสามารถของ Orion ยังไม่ก้าวกระโดดไปจาก GPT-4 อย่างที่คาดหวัง และอีกปัญหาสำคัญคือการเทรนแต่ละครั้ง กินเวลา 6 เดือน ใช้ทรัพยากรเพื่อประมวลผลอย่างเดียวราว 500 ล้านดอลลาร์ ซึ่งเป็นต้นทุนทั้งเงินและเวลาที่สูงกว่าทุกครั้ง

Tags:
Topics: 
Node Thumbnail

OpenAI เปิดตัวโมเดล o3 โมเดลที่พยายามคิดเป็นขั้น โดยมุ่งเป้าแก้ปัญหาที่ยากมาก เช่น ปัญหาคณิตศาสตร์ระดับงานวิจัยที่แม้แต่นักคณิตศาสตร์ก็อาจจะใช้เวลาเป็นวัน หรือชุดทดสอบ ARC-AGI ที่เป็นชุดทดสอบวัดไอคิว โดย เปิดตัวมาตั้งแต่ปี 2019 ที่ผ่านมาไม่มีปัญญาประดิษฐ์ใดได้คะแนนถึง 50% แม้มนุษย์จะได้คะแนนประมาณ 85%

Tags:
Node Thumbnail

ทีมวิศวกรของฝ่ายวิจัย Machine Learning ของแอปเปิล เผยแพร่รายละเอียดตัวเร่งการทำ LLM Inference โดยร่วมมือกับ NVIDIA เพื่อทดสอบประสิทธิภาพบนจีพียูของ NVIDIA

เครื่องมือที่แอปเปิลพัฒนาและโอเพนซอร์สนี้ชื่อว่า Recurrent Drafter หรือย่อว่า ReDrafter เป็นโมเดลที่รวมสองอัลกอริทึมคือ Beam Search กับ Dynamic Tree Attention เพื่อเร่งความเร็วในการสร้างโทเค็นผลลัพธ์ของ LLM สูงสุดที่ระดับ 3.5 โทเค็นต่อหนึ่งขั้นตอนของโมเดลโอเพนซอร์ส

ผลการทดสอบความเร็วในการสร้างโทเค็นผลลัพธ์ด้วย TensorRT-LLM ของ NVIDIA พบว่า ReDrafter ทำงานได้เร็วกว่าวิธีดั้งเดิม 2.7 เท่า ทำให้วิธีการนี้อาจนำมาช่วยให้การสร้างผลลัพธ์ของ LLM ให้เร็วขึ้นในมุมผู้ใช้งาน และลดการใช้ทรัพยากรจีพียูลงได้ด้วย

Pages