กลุ่ม Ultra Accelerator Link หรือ UALink ที่ร่วมกำหนดมาตรฐานการเชื่อมต่อระหว่างจีพียูในศูนย์ข้อมูล ประกาศรายชื่อบริษัทที่เข้าร่วมกลุ่มเพิ่มเติมได้แก่ Apple, Alibaba Cloud และ Synopsys ซึ่งจะมาร่วมผลักดันมาตรฐานเทคโนโลยี UALink ทำให้ตอนนี้กลุ่มมีสมาชิกแล้ว 65 บริษัท
UALink ก่อตั้งเมื่อปีที่แล้ว โดยบริษัทผู้ผลิตซีพียูรายใหญ่ทั้ง AMD, Intel ร่วมด้วยบริษัทเทคโนโลยีหลายแห่ง เหตุผลหนึ่งก็เพื่อคานอำนาจกับ มาตรฐานรับส่งข้อมูล NVLink ของ NVIDIA ที่เป็นผู้ผลิตจีพียูรายใหญ่ในโลกตอนนี้
Alibaba Cloud เปิดบริการ Qwen Chat แบบเดียวกับ ChatGPT ให้ลูกค้าบุคคลทั่วไปใช้งาน จากเดิม Qwen เปิดให้บริการ API บน Alibaba Cloud สำหรับลูกค้าองค์กรเป็นหลัก
Qwen Chat ให้บริการทั้งโมเดล Qwen เวอร์ชั่นโอเพนซอร์สและเวอร์ชั่นปิดที่เคยต้องเรียกผ่าน API เท่านั้น รวมถึงโมเดลแบบคิดก่อนตอบอย่าง QwQ และ QVQ ด้วย
หน้าจอใช้ OpenWebUI แบบเดียวกับที่จุฬาลงกรณ์มหาวิทยาลัยใช้งาน ทำให้มีฟีเจอร์ตามมาหลายตัว เช่น การเปรียบเทียบโมเดลรุ่นต่างๆ ตอนนี้ยังไม่มีเงื่อนไขค่าบริการแต่อย่างใด
ที่มา - @Alibaba_Qwen
- Read more about Alibaba Cloud เปิดบริการ Qwen Chat ให้ผู้ใช้ทั่วไป
- 2 comments
- Log in or register to post comments
Alibaba Cloud ประกาศลดราคาค่าใช้งาน โมเดลปัญญาประดิษฐ์ ที่รับอินพุทเป็นรูปภาพและวิดีโอ Qwen-vl-max ลง 85% โดยราคาอยู่ที่ 0.003 หยวนต่อ 1,000 อินพุทโทเค็น
การลดราคานี้เพื่อให้โมเดลทำความเข้าใจรูปภาพของ Alibaba Cloud สามารถแข่งขันด้านราคากับโมเดลประเภทเดียวกันของ ByteDance ได้ ซึ่งคิดราคาที่ 0.003 หยวน เท่ากัน
ประกาศนี้สะท้อนว่าการแข่งขันเรื่องโมเดลปัญญาประดิษฐ์ของผู้ให้บริการในจีนมีเพิ่มมากขึ้น ปัจจุบันการให้บริการโมเดลปัญญาประดิษฐ์ในจีน ต้องได้รับการอนุมัติจากหน่วยงานก่อน ซึ่งตอนนี้มีโมเดล Generative AI ที่ถูกอนุมัติแล้ว 252 โมเดล ผู้ให้บริการจึงเริ่มใช้การลดราคา มาดึงดูดให้เกิดการเลือกใช้งาน
ทีม Qwen ของ Alibaba Cloud เปิดโมเดล QvQ-72B-Preview ที่พัฒนาต่อจาก Qwen-VL-72B แต่ฝึกให้คิดเป็นขั้นเป็นตอนเพื่อเพิ่มความแม่นยำมากขึ้น
ผลทดสอบที่ทีม Qwen ใช้ทดสอบมี 4 ชุด ได้แก่ MMMU, MathVista, MathVision, และ OlympiadBench คะแนนที่ได้ขึ้นไปถึงระดับ Claude 3.5 Sonnet เข้าใกล้ OpenAI o1 มากขึ้น โดยพฤติกรรมของโมเดลจะคิดไปเรื่อยๆ และตอบคำถามสุดท้าย
โมเดลเปิดให้ทดสอบผ่าน HuggingFace ไฟล์โมเดลเปิดให้ดาวน์โหลดในไลเซนส์แบบ Qwen License โดยตอนนี้ยังส่งคำสั่งได้รอบเดียว ไม่สามารถคุยต่อเนื่องได้
ที่มา - QwenLM
- Read more about Alibaba Cloud เปิดตัว QvQ-72B โมเดลคิดก่อนตอบแถมดูภาพได้
- Log in or register to post comments
ทีม Qwen ของ Alibaba Cloud เปิดโตัวโมเดลปัญญาประดิษฐ์ QwQ (อ่านว่า ควิว/quil) เป็นโมเดลเพื่อการทดลองที่จะไม่มุ่งตอบคำถามทันที แต่พยายามคิดทบทวนก่อน ทำให้คำตอบที่ได้แม่นยำขึ้น
ความโดดเด่นของ QwQ-32B คือคะแนนทดสอบหลายชุดทดสอบ เช่น GPQA, AIME, MATH-500, หรือ LiveCodeBench นั้นสูงขึ้นมาก เทียบชั้นกับ OpenAI o1-preview เลยทีเดียว อย่างไรก็ดีทีมงานพบปัญหาการคิดของโมเดลมักสลับภาษาไปมา (ผมทดลองถามภาษาไทยก็คิดเป็นภาษาจีน) บางครั้งคิดวนไปวนมาไม่ได้คำตอบ นอกจากนี้ยังต้องเพิ่มความระมัดระวังความปลอดภัยในการใช้งาน และคะแนนทดสอบก็อาจจะมีข้อจำกัดไม่สามารถทดสอบความสามารถบางด้าน
Alibaba เปิดโมเดล Qwen2.5-Turbo โมเดลปัญญาประดิษฐ์ที่ปรับปรุงขึ้นจากรุ่นโอเพนซอร์ส เน้นขนาดข้อมูลที่รองรับได้ จากเดิม 128,000 โทเค็นเป็น 1 ล้านโทเค็น ทำให้รองรับข้อมูลระดับหนังสือทั้งเล่มได้ คิดเป็นขนาดข้อมูลประมาณ 1 ล้านคำหรืออักษรจีน 1.5 ล้านตัวอักษร
ผลทดสอบของ Qwen2.5-Turbo ค่อนข้างดีมากการถามตอบจากข้อมูลขนาดใหญ่ Passkey Retrieval ได้เต็ม 100 คะแนน ขณะที่ชุดทดสอบ RULER ก็ได้คะแนนสูงกว่า GPT-4 เมื่อใส่ข้อมูลเต็ม 1 ล้านโทเค็นจะเริ่มตอบใน 68 วินาที ราคาต่อ 1 ล้านโทเค็นอยู่ที่ 0.3 หยวน ถูกกว่า GPT-4o-mini อยู่ 4.6 เท่าตัว
Alibaba รายงานผลประกอบการของไตรมาสเดือนกันยายน 2024 รายได้รวมเพิ่มขึ้น 5% จากช่วงเดียวกันในปีก่อนเป็น 236,503 ล้านหยวน กำไรสุทธิอยู่ที่ 43,547 ล้านหยวน เพิ่มขึ้น 63% ซึ่ง Alibaba เป็นผลจากการบันทึกกำไรของการลงทุนในบริษัทอื่นที่เพิ่มขึ้นมาก
กลุ่มอีคอมเมิร์ซในจีน (Taobao และ Tmall) มีรายได้เพิ่มขึ้น 1% เป็น 98,994 ล้านหยวน โดย Alibaba บอกว่ายอดขายสุทธิหรือ GMV ยังคงเติบโตดี และเทศกาล 11.11 ที่ผ่านมาก็ทำสถิติสูงสุดอีกปี ส่วนกลุ่มคลาวด์มีรายได้ 29,610 ล้านหยวน เพิ่มขึ้น 7% โดยบอกว่าบริการที่เกี่ยวกับ AI มีการเติบโตระดับเลขสามหลักต่อเนื่องกันเป็นไตรมาสที่ห้าแล้ว
สถาบัน DAMO ของ Alibaba รายงานความสำเร็จในการพัฒนาโมเดลปัญญาประดิษฐ์ "ปากวน" สำหรับทำนายสภาพอากาศอย่างละเอียดระดับชั่วโมงไปได้ถึงสิบวันข้างหน้า ในแง่พื้นที่สามารถทำนายได้ละเอียด 1 ตารางกิโลเมตร
ทีมงานอาศัยชุดข้อมูล ERA5 ที่เก็บบันทึกสภาพอากาศตั้งแต่ปี 1979 ร่วมกับข้อมูลท้องถิ่น เช่น อุณหภูมิ, แรงลม, และระดับแสงแดด
ทาง Aliababa นำ Baguan ไปสาธิตในการจัดการพลังงาน โดยโมเดลสามารถทำนายเหตุการณ์อุณหภูมิลดลงอย่างรวดเร็วในจีนได้อย่างแม่นยำ ทำให้การไฟฟ้าสามารถทำนายได้ว่าการใช้พลังงานจะลดลงอย่างรวดเร็วเหมือนกัน โดยรวมการใช้สภาพอากาศเข้ามาร่วมทำให้สามารถทำนายความต้องการไฟฟ้าได้แม่นยำ 98.1%
ทีมวิจัย Qwen ของ Aliababa เปิดตัวโมเดล Qwen2.5-Coder โมเดล LLM ช่วยเขียนโค้ดที่ปรับปรุงกระบวนการฝึกจนได้ประสิทธิภาพสูงสุดในหมู่โมเดลโอเพนซอร์ส คะแนนทดสอบรวมพอๆ กับ GPT-4o ในการทดสอบหลายตัว
กระบวนการฝึก Qwen2.5-Coder นั้นอาศัยการฝึกเป็นขั้น เริ่มตั้งแต่การฝึกโค้ดแบบไฟล์เดี่ยว (file-level pretrain) แล้วขยับมาเป็นการฝึกแบบหลายไฟล์ (repo-level pretrain) สุดท้ายจึงฝึกการเขียนโค้ดตามคำสั่ง โดยอาศัยชุดข้อมูลโค้ดที่พบในอินเทอร์เน็ต นำมาสร้างคำสั่งเพื่อให้ได้โค้ดนั้น แล้วจึงนำชุดข้อมูลไปฝึก
จุดเด่นสำคัญของ Qwen2.5-Coder คือมันสามารถสร้างโค้ดได้หลายภาษาในคุณภาพค่อนข้างสูง เนื่องจากทีมงานสร้างชุดข้อมูลภาษาโปรแกรมอื่นๆ ที่มีชุดข้อมูลน้อยเพิ่มเข้ามา
Alibaba Cloud เปิดบริการ LLM ของตัวเองในตระกูล Qwen แต่เป็นเวอร์ชั่นไม่เปิดให้ดาวน์โหลดโมเดล ได้แก่ Qwen-Max, Qwen-Plus, และ Qwen-Turbo โดยชูความสามารถของ Qwen-Max ว่าใกล้เคียง Llama3.1-405B และ GPT-4o แล้ว โดยเอาชนะได้บางขุดทดสอบ เช่น MATH หรือ LiveCodeBenach
ราคาค่าใช้งาน Qwen-Max อยู่ที่ 10 ดอลลาร์ต่อล้านโทเค็นสำหรับอินพุต และ 30 ดอลลาร์ต่อล้านโทเค็นสำหรับเอาท์พุต แพงกว่า GPT-4o ประมาณเท่าตัว
สำหรับโมเดลอื่นๆ ที่เปิดตัวมาพร้อมกัน เช่น Tongyi Wanxiang โมเดลสร้างภาพและวิดีโอจากข้อความ, Qwen2-VL โมเดลที่รับภาพและวิดีโอ, AI Developer ตัวช่วยเขียนโปรแกรม
Alibaba Cloud เปิดตัวโมเดลปัญญาประดิษฐ์ Qwen เวอร์ชั่น 2.5 จุดเด่นของโมเดลเวอร์ชั่นนี้คือฝึกด้วยข้อมูลขนาดถึง 18 ล้านล้านโทเค็น รองรับ 29 ภาษารวมภาษาไทย โดยเปิดให้ใช้งานได้อิสระแทบทุกรุ่น
ตัวโมเดลรองรับอินพุต 128K token และตอบข้อมูลได้ 8K token ยกเว้นรุ่น 3B ลงไปจะรองรับอินพุต 32K token เท่านั้น
รุ่นใหญ่สุด Qwen2.5-72B ได้ผลทดสอบชนะ Llama3.1-70B แทบทุกการทดสอบขึ้นไปใกล้เคียง Llama3.1-405B แต่เวอร์ชั่น 72B แจกแบบ Qwen License ซึ่งจำกัดการใช้งานกับบริการที่ผู้ใช้เกิน 100 ล้านคนต่อเดือน
เมื่อวานนี้เกิดเหตุไฟไหม้ศูนย์ข้อมูล Alibaba Cloud Zone C ในสิงคโปร์ กระทบบริการจำนวนมาก โดยต้นเพลิงเกิดจากแบตเตอรีลิเธียมในศูนย์ข้อมูล
กระบวนการดับเพลิงกินเวลา 4 ชั่วโมง ตั้งแต่ 10:20-14:40 ตามเวลาปักกิ่ง แต่หลังจากควบคุมเพลิงได้แล้วก็ยังมีความร้อนอยู่ ทำให้ทีมงานไม่สามารถเข้าพื้นที่ได้ และอุปกรณ์เน็ตเวิร์คทำงานผิดปกติ ตลอดจนมีน้ำดับเพลิงเข้าไปในห้องเซิร์ฟเวอร์ ทำให้กระบวนการกู้คืนระบบใช้เวลา
ทาง Alibaba Cloud ระบุว่าระบบที่เปิด high availability เอาไว้สามารถย้ายระบบออกไปโดยอัตโนมัติได้ตามที่คาดหวัง เช่น Redis, MongoDB, MySQL แต่บริการที่เปิดใช้แบบ single availability zone เช่น object storage หรือฐานข้อมูลต่างๆ หากอยู่ใน Zone C ก็จะดับไป
Alibaba Cloud ปล่อยโมเดล LLM ตระกูล Qwen 2 รุ่นล่าสุด Qwen2-VL โดย VL ย่อมาจาก Vision Language ที่พัฒนาบนพื้นฐานของ Qwen2
Qwen2-VL มีจุดเด่นคือความสามารถในการทำความเข้าใจรูปภาพ ที่มีความละเอียดและอัตราส่วนภาพหลากหลาย ผลการทดสอบทำงานได้ดีกว่าโมเดลประเภทเดียวกัน ซึ่งสามารถนำไปประยุกต์ใช้ได้กับอุปกรณ์ที่ต้องใช้การทำความเข้าใจภาพที่เห็น เช่น สมาร์ทโฟน, หุุ่นยนต์ หรือระบบอัตโนมัติอื่นที่ต้องอาศัยภาพในการตัดสินใจ
ความสามารถของ Qwen2-VL ยังสามารถสรุปเนื้อหาวิดีโอได้ที่ความยาวถึง 20 นาที โดยสามารถตอบคำถามเนื้อหาจากวิดีโอ หรือสรุปบทสนทนาได้ด้วย ภาษาที่รองรับได้แก่ ภาษาเกือบทั้งหมดที่ใช้ในทวีปยุโรป, ภาษาญี่ปุ่น, ภาษาเกาหลี, ภาษาอาหรับ, ภาษาเวียดนาม และอื่น ๆ
Alibaba Cloud ปล่อยโมเดล LLM แบบโอเพนซอร์สตระกูล Qwen 2 เพิ่มอีกสองรุ่น ได้แก่ Qwen2-Math และ Qwen2-Audio
Qwen2-Math เป็นโมเดลที่ฝึกต่อจก Qwen2 โดยสร้างชุดข้อมูลคุณภาพสูงด้านคณิตศาสตร์เฉพาะ ทั้งหนังสือ, โค้ดต่างๆ, ชุดข้อสอบต่างๆ, จนถึงข้อมูลที่สังเคราะห์ออกมาจาก Qwen2 เอง จุดเด่นของโมเดลนี้คือทำคะแนนทดสอบด้านคณิตศาสตร์ เช่น GSM8K, MATH หรือ MMLU-STEM ได้สูงกว่าโมเดลปิดอย่าง GPT-4o หรือ Gemini เสียอีก
Qwen2-Math ยังใช้งานได้เฉพาะภาษาอังกฤษเท่านั้น และมี 3 ขนาด คือ 1.5B, 7B, 72B เปิดให้ใช้งานแบบสัญญาอนุญาต Apache 2.0 ทีมงานระบุว่าจะเปิดเวอร์ชั่นภาษาจีนเร็วๆ นี้
Alibaba จัดการแข่งขัน Alibaba Global Math Competition การแข่งขันคณิตศาสตร์ที่เริ่มมาตั้งแต่ปี 2018 แต่ปีนี้มีความพิเศษคือเปิดให้ AI เข้ามาแข่งขันด้วย อย่างไรก็ดีทีมที่ใช้ AI ตกรอบทั้งหมดตั้งแต่รอบคัดตัว เหลือผู้เข้าแข่ง 802 คน
คะแนนรอบคัดตัวต้องการคะแนนขั้นต่ำ 45 คะแนน แต่ทีม AI ที่ได้คะแนนสูงสุดได้เพียง 34 คะแนนเท่านั้น และคะแนนเฉลี่ยของ AI อยู่ที่ 18 คะแนนพอๆ กับผู้เข้าแข่งทั่วไป โดยผู้เข้าแข่งที่ทำคะแนนได้ดีที่สุดทำคะแนนได้ถึง 113 คะแน ข้อสอบมีทั้งหมด 7 ข้อ มีทั้งแบบตัวเลือกและแบบแสดงวิธีทำ
ทีมวิจัย Qwen ของ Alibaba Cloud เปิดตัวโมเดล LLM ในชื่อ Qwen2 มี 5 ขนาดให้เลือกตั้งแต่ 0.5B, 1.5B, 7B, 14B, และ 72B โดยชูจุดเด่นรองรับภาษาอื่นๆ นอกจากภาษาอังกฤษ เช่นแถบเอเชียตะวันออกเฉียงใต้นั้นรองรับทั้ง ไทย, เวียดนาม, อินโดนีเซีย, เมียนมาร์, ลาว, กัมพูชา และยังรองรับ context window ถึง 128K
ผลทดสอบยอดนิยมเช่น MMLU หรือ HumanEval นั้น Qwen2-72B ทำได้เหนือกว่า Llama3-70B ไปเล็กน้อย ขณะที่ Qwen2-7B ก็เอาชนะ Llama3-7B ได้หลายชุดทดสอบโดยเฉพาะชุดทดสอบ HumanEval ที่คะแนนนำค่อนข้างมาก
Qwen2 ปล่อยให้ใช้งานแบบ Apache 2.0 ยกเว้นเฉพาะ Qwen2-72B เท่านั้นที่ยังจำกัดการใช้งานแบบ Qianwen License ทำให้โมเดลขนาด 7B สามารถใช้งานได้แทบไม่มีข้อจำกัด
Bloomberg รายงานสงคราม AI ฝั่งจีนที่กำลังร้อนแรงในช่วงสัปดาห์ที่ผ่านมา หลังค่าย Alibaba เปิดสงครามราคา หั่นค่าใช้บริการ AI ของตัวเองที่ชื่อ Qwen (ชื่อเต็มคือ Tongyi Qianwen) ลงมากถึง 97% บีบให้คู่แข่งต้องเล่นสงครามราคาตาม
หลังจากนั้นไม่กี่ชั่วโมง ค่าย Baidu ประกาศว่าบริการ Ernie AI บางโมเดลย่อยเปลี่ยนมาให้บริการฟรี และฝั่งค่าย ByteDance ก็ต้องลดราคาโมเดล Doubao 99% ตามมาด้วยเช่นกัน
เมื่อต้นเดือนนี้ Alibaba เพิ่งออก Qwen เวอร์ชัน 2.5 ที่มีความสามารถมากขึ้น อย่างไรก็ตาม การใช้งานโมเดล AI จากฝั่งจีนยังจำกัดเฉพาะบริษัทจีนซะมาก ตัวอย่างลูกค้าที่ Alibaba นำมาโชว์ยังมีเฉพาะบริษัทจีนด้วยกันเอง เช่น Xiaomi และ Perfect World Games
Alibaba Cloud ประกาศในงานสัมมนาที่ปารีส เปิดพื้นที่ให้บริการเขตเม็กซิโกเป็นครั้งแรก และประกาศขยายศูนย์ข้อมูลเพิ่มใน 4 ประเทศคือ มาเลเซีย ฟิลิปปินส์ เกาหลีใต้ และ ไทยในช่วงเวลา 3 ปีข้างหน้า
Alibaba Cloud มีให้บริการ Availability Zone ในประเทศไทยมาตั้งแต่ปี 2022 ประกาศนี้บอกคร่าวๆ เพียงว่าจะขยายศูนย์ข้อมูลเพิ่มเติมอีก แต่ยังไม่ให้รายละเอียดมากไปกว่านี้
ในภูมิภาคเอเชียตะวันออกเฉียงใต้ Alibaba Cloud มีศูนย์ข้อมูลให้บริการใน 5 ประเทศคือ สิงคโปร์ (3 โซน), มาเลเซีย (2 โซน), อินโดนีเซีย (3 โซน), ฟิลิปปินส์ (1 โซน) และไทย (1 โซน) - แผนที่ละเอียด
Alibaba Cloud ประกาศว่า Tongyi Qianwen หรือ Qwen โมเดลปัญญาประดิษฐ์ภาษาขนาดใหญ่หรือ LLM มีหน่วยงานนำไปติดตั้งใช้งานแล้วมากกว่า 90,000 แห่ง สะท้อนความต้องการใช้งานที่เพิ่มต่อเนื่องจาก ทั้งจากกลุ่มอุตสาหกรรมอิเล็กทรอนิกส์, ยานยนต์ จนถึงเกม
โดย Alibaba Cloud ได้อัปเดตโมเดล Qwen นี้ในเวอร์ชันล่าสุด Qwen2.5 โดยมีจุดเด่นคือการให้เหตุผล ประเมินโค้ด และทำความเข้าใจภาษาได้ดีกว่าเวอร์ชันก่อนหน้า Qwen2.0
DAMO Academy โครงการสนับสนุนงานวิจัยและพัฒนาเทคโนโลยีใหม่ของ Alibaba ประกาศบริจาคห้องปฏิบัติการด้านควอนตัม และอุปกรณ์ที่เกี่ยวข้อง ให้กับ Zhejiang University ในเมืองหางโจว โดย Alibaba ยืนยันการบริจาคนี้กับสื่อท้องถิ่น
อย่างไรก็ตามในรายงานนั้นบอกว่าสาเหตุที่ Alibaba บริจาคอุปกรณ์และห้องปฏิบัติการ ก็เพราะบริษัทตัดสินใจลดค่าใช้จ่าย โดยตัดกิจกรรมที่เกี่ยวข้องการงานวิจัยส่วนห้องปฏิบัติการควอนตัมนี้ กระทบกับพนักงานที่ทำงานในห้องปฏิบัติการนี้ประมาณ 30 คน
Alibaba ปรับโครงสร้างฝ่ายบริหารใน Alibaba Cloud ส่วนธุรกิจให้บริการคลาวด์ ที่ก่อนหน้านี้ Alibaba จะ แยกธุรกิจ ออกมาตามแผน แต่ล่าสุดบริษัทรายงานว่าได้ เลื่อนแผนไอพีโอ ธุรกิจคลาวด์นี้ออกไปก่อน
Alibaba Cloud จะปรับโครงสร้างให้มีผู้บริหารรับผิดชอบแต่ละหน่วยธุรกิจย่อย ซึ่งมี 3 แผนกคือ Public Cloud, Hybrid Cloud และ Cloud Infrastructure มี Weiguang Liu ดูส่วน Public Cloud, Jin Li ดูส่วน Hybrid Cloud ทั้งสองคนจะขึ้นตรงกับ Eddie Wu ซีอีโอ Alibaba Cloud และเป็นซีอีโอของ Alibaba Group บริษัทแม่หลักด้วย ส่วน Jiangwei Jiang ที่รับผิดชอบ Infrastructure จะขึ้นตรงกับซีทีโอ Jingren Zhou
Alibaba รายงานผลประกอบการของไตรมาสเดือนกันยายน รายได้เพิ่มขึ้น 9% เทียบกับไตรมาสเดียวกันในปีก่อนเป็น 224,790 ล้านหยวน มีกำไรสุทธิ 27,706 ล้านหยวน
Eddie Wu ซีอีโอคนใหม่ของ Alibaba กล่าวในช่วงแถลงผลประกอบการว่าบริษัทพร้อมลงทุนเพื่อการเติบโต ด้วยสถานะทางการเงินที่ไม่เคยดีเท่านี้มาก่อน บริษัทสร้างกระแสเงินสดอิสระย้อนหลัง 12 เดือน ได้มากถึง 2.7 หมื่นล้านดอลลาร์ และตอนนี้มีเงินสดในมือ 6.3 หมื่นล้านดอลลาร์ บริษัทจึงประกาศจ่ายเงินปันผลให้ผู้ถือหุ้นเป็นครั้งแรกของบริษัท ที่ 0.125 ดอลลาร์ต่อหุ้นปกติ และ 1.00 ดอลลาร์ต่อหุ้น ADS
มีรายงานว่า Alibaba ได้ออกอีเมลแจ้งภายในบริษัทว่า Daniel Zhang จะลาออกจากตำแหน่งซีอีโอของส่วนธุรกิจคลาวด์ ซึ่งเป็นตำแหน่งที่เขาเพิ่ง ย้ายมา เป็นเมื่อปลายเดือนมิถุนายน ตามแผนการปรับโครงสร้างองค์กรของ Alibaba ที่แยกธุรกิจออกเป็นบริษัทย่อย
Eddie Wu ประธานกลุ่ม Alibaba ซึ่งเป็นตำแหน่งก่อนหน้านี้ของ Zhang ด้วย จะมารับตำแหน่งซีอีโอส่วนธุรกิจคลาวด์นี้เพิ่มอีกตำแหน่ง
กลุ่มธุรกิจ Alibaba Cloud เป็นหนึ่งในธุรกิจที่ Alibaba โฟกัสมากเป็นพิเศษหลังการ แยกออกมาเป็น 6 บริษัท โดยมีแผนนำบริษัทเข้าตลาดหุ้นให้ได้ภายใน 12 เดือน มูลค่ากิจการคาดว่าอยู่ที่ 4-6 หมื่นล้านดอลลาร์
Alibaba Cloud เปิดตัวโมเดลภาษาภาพขนาดใหญ่ (Large Vision Language) แบบโอเพนซอร์ส ซึ่งมีความสามารถในการเข้าใจภาพและตัวหนังสือ
สองโมเดลได้แก่ Qwen-VL เป็นโมเดลภาษาภาพขนาดใหญ่ที่ถูกเทรนมาก่อน และ Qwen-VL-Chat โมเดลสำหรับการสนทนาโต้ตอบ ขนาด 7 พันล้านพารามิเตอร์ มีความสามารถทำความเข้าใจภาพในภาษาอังกฤษและภาษาจีน และสร้างบทสนทนาโต้ตอบ รวมถึงทำงานประมวลผล เช่น บวกเลขในภาพได้ ซึ่งสามารถนำมาช่วยทั้งการอ่านป้ายภาษาจีน สำหรับคนที่ไม่รู้ภาษาจีน หรือใช้ช่วยอ่านป้ายต่าง ๆ สำหรับผู้มีปัญหาการมองเห็น
ทั้ง Qwen-7B และ Qwen-7B-Chat เปิดให้ดาวน์โหลดใช้งานแล้วที่ ModelScope ซึ่งเป็นชุมชนนักพัฒนา AI ของ Alibaba Cloud และที่ Hugging Face
Alibaba Cloud เปิดซอร์สโค้ดของโมเดลภาษาขนาดใหญ่ (LLM) ชื่อ Tongyi Qianwenที่เคย เปิดตัวครั้งแรกเมื่อเดือนเมษายน 2023 ออกสู่สาธารณะ
โมเดลที่เปิดซอร์สโค้ดออกมายังมีเฉพาะรุ่นเล็ก Qianwen-7B และ Qianwen-7B-Chat ขนาด 7 พันล้านพารามิเตอร์ รองรับบทสนทนาขนาดยาว 8K, คลังคำศัพท์ 150K tokens (Qianwen ตัวเต็มมีขนาดใหญ่ถึง 10 ล้านล้านพารามิเตอร์ และถูกใช้กับบ็อตสนทนาของ Alibaba เอง เช่น DingTalk หรือ Tmall Genie )