เพียงหนึ่งปีของการเปิดตัว Qwen Models ของ Alibaba Cloud มีองค์กรนำไปใช้งานแล้วมากกว่า 90,000 แห่ง
บริษัทฯ ซึ่งเป็นผู้บุกเบิกด้าน MaaS อัปเกรดแพลตฟอร์มที่ใช้พัฒนา AI ของบริษัทฯ เปิดเผยการเพิ่มประสิทธิภาพใหม่ให้กับ LLM Model ที่เป็นกรรมสิทธิ์ของบริษัทฯ และขยายบริการที่เป็นโอเพ่นซอร์สเพื่อรองรับความต้องการ generative AI ที่เพิ่มสูงขึ้น
อาลีบาบา คลาวด์ ธุรกิจด้านเทคโนโลยีดิจิทัล และหน่วยงานหลักด้านอินเทลลิเจนซ์ของอาลีบาบา กรุ๊ป ประกาศความสำเร็จครั้งยิ่งใหญ่ของ Qwen หรือที่รู้จักกันในชื่อ “Tongyi Qianwen” ซึ่งเป็นตระกูลโมเดลด้านภาษาขนาดใหญ่ (LLMs) ที่เป็นกรรมสิทธิ์ของบริษัทฯ ที่ออกสู่ตลาดเมื่อเดือนมิถุนายนปีที่ผ่านมา และมีองค์กรมากกว่า 90,000 แห่งใช้งานผ่าน Model Studio ซึ่งเป็นแพลตฟอร์ม generative AI ของ Alibaba Cloud การใช้งานโดยองค์กรจำนวนมากนี้แสดงให้เห็นว่า Qwen ได้รับการสนับสนุนอย่างแข็งแกร่งจากอุตสาหกรรมต่างๆ ในอันดับต้นๆ ไม่ว่าจะเป็นอุตสาหกรรมอิเล็กทรอนิกส์สำหรับผู้บริโภค, อุตสาหกรรมรถยนต์ ไปจนถึงอุตสาหกรรมเกม ส่งให้ Qwen เป็นหนึ่งในกลุ่ม LLMs ที่เป็นที่ต้องการมากที่สุดในประเทศจีน
เพื่อตอบสนองความต้องการโซลูชัน AI ที่เพิ่มขึ้น Alibaba Cloud เสนอ Qwen2.5 ซึ่งเป็นเวอร์ชันล่าสุดในตระกูล Qwen model นอกจากนี้บริษัทฯ ยังคงสานต่อพันธสัญญาต่อโอเพ่นซอร์สคอมมิวนิตี้ ด้วยการเปิดตัวชุด Qwen models ใหม่ๆ ทั้งยังได้อัปเกรด Model Studio ของบริษัทฯ ด้วยการเพิ่มทรัพยากรที่ใช้ในการพัฒนา AI เพื่อเติมเต็มความต้องการด้าน AI ของผู้ใช้งานระดับองค์กรที่เพิ่มสูงขึ้น
นายจิงเหริน โซว ประธานเจ้าหน้าที่ฝ่ายเทคโนโลยี ของอาลีบาบา คลาวด์ กล่าวว่า “การได้เห็นความต่อเนื่องและความแข็งแกร่งที่เพิ่มมากขึ้นของโมเดลขนาดใหญ่ด้านภาษาในตระกูล Qwen เป็นการเดินทางที่น่าตื่นเต้น เนื่องมาจากการได้รับการต้อนรับอย่างดีจากลูกค้าองค์กรอย่างชัดเจน และเราได้เห็นการนำโมเดลต่างๆ ไปใช้ในวงกว้างอย่างสร้างสรรค์ในทุกอุตสาหกรรม ในเวลาเดียวกัน เราได้ทุ่มเทเพื่อเพิ่มความสามารถให้กับโมเดลต่างๆ และเพิ่มประสิทธิภาพให้กับบริการด้านการพัฒนา AI อย่างต่อเนื่อง เพื่อมอบแอปพลิเคชันใหม่ๆ ที่ล้ำสมัยให้กับลูกค้าของเรา”
“เราจะยังคงสนับสนุนโมเดล AI หลายรูปแบบให้กับโอเพ่นซอร์สคอมมิวนิตี้อย่างต่อเนื่อง และยินดีร่วมมือกับลูกค้าของเราและนักพัฒนาซอฟต์แวร์เพื่อคว้าโอกาสเติบโตที่ยิ่งใหญ่ที่การพัฒนา generative AI ล่าสุดที่เพิ่มมากขึ้นอย่างรวดเร็วมีให้”
องค์กรนำ Qwen ไปใช้ผ่าน Model Studio มากขึ้น
ตั้งแต่เปิดแพลตฟอร์มพัฒนา AI เมื่อเดือนมิถุนายนปีที่ผ่านมา มีการนำโมเดลในตระกูล Qwen ไปใช้ในองค์กรมากกว่า 90,000 ราย ผ่าน Model Studio นอกจากนี้ผู้ใช้ที่เป็นองค์กรมากกว่า 2.2 พันรายยังใช้บริการ AI ที่ขับเคลื่อนด้วย Qwen จาก DingTalk ซึ่งเป็นแพลตฟอร์มอัจฉริยะที่ใช้ทำงานและพัฒนาแอปพลิเคชันร่วมกัน
ในขณะเดียวกัน open-source Qwen series ที่มีโมเดลหลากหลายขนาด ตั้งแต่ 0.5 พันล้านถึง 110 พันล้านพารามิเตอร์ มียอดดาวน์โหลดมากกว่า 7 ล้านครั้งบนแพลตฟอร์มต่างๆ รวมถึง Hugging Face และ Github
ยิ่งไปกว่านั้น ModelScope ซึ่งเป็นคอมมิวนิตี้ของ AI model ใหญ่ที่สุดในจีน ที่ Alibaba Cloud เป็นผู้นำ ปัจจุบันมีโมเดลมากกว่า 4,000 รายการและมีฐานนักพัฒนาซอฟต์แวร์ที่เชี่ยวชาญ 5 ล้านคนที่มีส่วนร่วมอย่างแข็งขันตลอดหลายปีที่ผ่านมา
การบูรณาการ Qwen ไว้ในอุตสาหกรรมอิเล็กทรอนิกส์สำหรับผู้บริโภคและอุตสาหกรรมเกม
Xiaomi ผู้นำด้านอิเล็กทรอนิกส์สำหรับผู้บริโภคและการผลิตอัจฉริยะ ได้ผสานรวมโมเดลของ Alibaba Cloud เข้ากับ Xiao Ai ซึ่งเป็นผู้ช่วยที่เป็น AI ของบริษัทฯ เพื่อเพิ่มสมรรถนะให้กับฟีเจอร์ต่างๆ เช่น การสร้างภาพและการทำความเข้าใจกลุ่มสมาร์ทโฟนรุ่นล่าสุดและยานพาหนะไฟฟ้าอัจฉริยะ
การบูรณาการนี้ช่วยให้ Xiao Ai สร้างภาพต่างๆ บนระบบสาระบันเทิง (infotainment) ในรถยนต์ได้อย่างไม่ยุ่งยากด้วยคำสั่งเสียง ผู้โดยสารจะได้รับประสบการณ์ภายในยานพาหนะที่รุ่มรวยด้วยตัวเลือกความบันเทิงต่างๆ ที่โต้ตอบและตอบสนองต่อคำสั่งหรือการกระทำของผู้ใช้ได้
ผู้ใช้สมาร์ทโฟนของ Xiaomi ยังสามารถเลือกใช้ Tongyi Wanxiang ซึ่งเป็นโมเดลที่ใช้ในการสร้างรูปภาพของ Alibaba Cloud และ Qwen-VL ซึ่งเป็น advanced vision-language สำหรับการใช้งานที่หลากหลาย เช่น การสร้างภาพ การวิเคราะห์ภาพถ่าย และการสร้างสูตรอาหารจากรูปภาพอาหาร ซึ่งทั้งหมดนี้ช่วยยกระดับประสบการณ์ผู้ใช้ได้มากขึ้น
Perfect World Games ซึ่งเป็นบริษัทเกมสัญชาติจีน ได้นำ Qwen ของ Alibaba Cloud ไปใช้ในการพัฒนาเกม ความสามารถของคลาวด์และ AI ที่ผสานรวมกันนี้ส่งผลเชิงบวกหลายด้านในการพัฒนาเกม เช่น โครงเรื่อง บทสนทนา การสร้างเสียงและแอนิเมชัน ในอนาคตความร่วมมือนี้จะกระชับแน่นมากขึ้นในเรื่ององค์ประกอบของเกม เช่น ตัวละครที่ AI เป็นผู้ควบคุม (AI non-player character: NPC), การสร้างคอนเทนต์แบบเรียลไทม์ เพื่อให้ AI ร่วมเป็นส่วนหนึ่งในประสบการณ์ที่ผู้เล่นจะได้รับในระหว่างการโต้ตอบกับเกม
ยกระดับ Model Studio เพื่อลูกค้าองค์กร
Alibaba Cloud ในฐานะผู้บุกเบิกแนวคิด Model-as-a-Service (MaaS) ตั้งแต่ปี 2565 นำเสนอบริการเต็มรูปแบบให้กับนักพัฒนาซอฟต์แวร์ เพื่อใช้โมเดล AI ได้อย่างง่ายดาย และสามารถสร้างนวัตกรรมที่ใช้ AI
Alibaba Cloud อัปเดท Model Studio ซึ่งเป็นโมเดล generative AI และแพลตฟอร์มการพัฒนาแอปพลิเคชันอย่างครอบคลุม เพื่อทำให้การเทรนด์โมเดลและการอนุมานมีประสิทธิภาพมากขึ้นและคุ้มค่าใช้จ่าย ด้วยโมเดลที่หลากหลายมากขึ้น รวมถึงมอบเครื่องมือและบริการด้าน AI ที่ใช้ในงานหลากหลาย
ปัจจุบันนักพัฒนาซอฟต์แวร์สามารถเข้าถึงโมเดลต่างๆ ที่ทรงประสิทธิภาพ ของ third-party ที่เป็นบริษัทด้าน AI เช่น Baichuan AI เป็นต้น พอร์ทโฟลิโอที่กว้างใหญ่ของ Model Studio ปัจจุบันมีโมเดลมากกว่าร้อยรายการอยู่แล้ว ซึ่งรวมถึง Qwen ขนาดต่างๆ ด้วย
Model Studio ที่ได้รับการเพิ่มประสิทธิภาพนี้ประกอบด้วยเครื่องมือที่ล้ำหน้าหลากหลายสำหรับนักพัฒนาซอฟต์แวร์ที่รวมเอา LlamaIndex ซึ่งเป็นเฟรมเวิร์กโอเพ่นซอร์สที่อำนวยความสะดวกให้กับการเพิ่มประสิทธิภาพ LLMs เพื่อการพัฒนาแอปพลิเคชัน เช่น แชทบอทและเครื่องมือต่างๆ ที่ใช้ในงานวิเคราะห์
นอกจากนี้ยังมี Assistant API ซึ่งเป็นฟีเจอร์ใหม่ที่ใช้ลดความซับซ้อนของการพัฒนาผู้ช่วยที่เป็น AI ฟีเจอร์นี้ช่วยให้การผสานรวมเทคโนโลยี Retrieval Augmented Generation (RAG) เป็นไปอย่างราบรื่น เพื่อสร้างการตอบสนองตาม context-aware และรองรับฟังก์ชันที่ทันสมัยต่างๆ เช่น multi-agent coordination และการจัดการหน่วยความจำ
แนะนำ Qwen2.5 และขยายการใช้ Open-source LLMs
Qwen2.5 ที่เปิดตัวล่าสุดนี้ มาพร้อมความล้ำสมัยที่โดดเด่นเมื่อเทียบกับ Qwen2.0 คือ เรื่องของการใช้เหตุผล, ความสามารถเรียนรู้และเข้าใจโค้ด, และความเข้าใจข้อความต้นฉบับ โดยขณะนี้พร้อมให้ใช้งานผ่าน Model Studio ได้แล้ว ทั้งนี้ OpenCompass ซึ่งเป็นระบบประเมินโมเดลขนาดใหญ่ ระบุว่า Qwen2.5 แสดงผลการประเมินในระดับที่มีความสามารถในการแข่งขันได้ ในหมวดหมู่ต่างๆ ใน SOTA (State-Of-The-Art) LLMs
Alibaba Cloud ในฐานะผู้สนับสนุนโอเพ่นซอร์สคอมมิวนิตี้ ยังได้เปิดให้ใช้โมเดล Qwen หลากหลายขนาด รวมถึง Qwen1.5-110B ที่มีพารามิเตอร์มากถึง 110 พันล้านตัว และเป็นโมเดลประสิทธิภาพสูงสุดในหมวดหมู่ pre-trained model บน OpenLLM Leaderboard นอกจากนี้ CodeQwen1.5-7B ซึ่งเป็นเวอร์ชันที่มี 7 พันล้านพารามิเตอร์ ยังครองตำแหน่งเป็นหนึ่งในโมเดลอันดับต้นๆ ใน Big Code Models Leaderboard ของ Hugging Face ในปัจจุบัน ทั้งนี้บริษัทฯ ได้วางแผนที่จะแชร์ Owen2.0 ที่มี 7 พันล้านและ 72 พันล้านพารามิเตอร์ในอีกไม่กี่เดือนข้างหน้า