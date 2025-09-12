Alibaba, Qwen3'ün Yeni Açık Kaynak Versiyonunu Piyasaya Sürdü

Çinli e-ticaret ve teknoloji grubu Alibaba, açık kaynaklı yapay zeka modeli Qwen3'ün geliştirilmiş versiyonunu duyurdu. South China Morning Post'un aktardığına göre, model Alibaba Cloud tarafından Qwen3-Next mimarisiyle geliştirildi ve kamuya sunuldu.

10 Kat Daha Ucuz, 10 Kat Daha Güçlü İddiası

Hugging Face'de yayımlanan notta, Qwen3-Next-80B-A3B adlı modelin önceki versiyon Qwen3-32B'ye kıyasla 10 kat daha ucuza eğitildiği ve aynı zamanda 10 kat daha güçlü işlem kabiliyetine sahip olduğu ifade edildi.

Mimari Yenilikler ve Optimizasyon

Geliştirici ekip, GitHub'da paylaştığı notlarda yeni mimarinin performansı maksimize etmeye ve işlem maliyetlerini düşürmeye yönelik bir dizi yenilik içerdiğini belirtti. Bu yenilikler arasında uzun metin girdilerini daha etkin işleyen hybrid attention (melez dikkat) ve modeli belirli alanlara odaklanan alt ağlara bölen high-sparsity mixture-of-experts (uzmanların yüksek-seyreklikte karışımı) teknikleri yer alıyor.

80 milyar parametreye sahip model, tüketici düzeyi donanımlarda etkin çalışacak şekilde optimize edildi; sınırlı işlemci gücüyle yüksek performans sunması, yapay zekanın yaygın kullanımını daha ulaşılabilir kılabilir.

Akıl Yürütme Modeli de Güncellendi

Alibaba, Qwen-3'ün akıl yürütme modelini de Next mimarisiyle güncelledi. Qwen3-Next-80B-A3B-Thinking adlı versiyonun bağımsız testlerde önceki Qwen3-32B-Thinking ile kıyaslandığında ve Google'ın Gemini-2.5-Flash-Thinking modeline karşı üstün performans gösterdiği bildirildi.

Qwen3'ün akıl yürütme modeli daha önce yapılan testlerde OpenAI'ın o1 ve DeepSeek'in R1 modellerine yaklaşan veya üstün performanslar sergilemişti.

Qwen3 Ailesi ve Büyük Modeller

Alibaba, Nisan ayında 600 milyondan 235 milyara kadar parametreye sahip 8 gelişmiş modelden oluşan Qwen3 ailesini piyasaya sürmüştü. Şirket, 8 Eylül'de duyurduğu 1 trilyon parametreli Qwen3-Max-Preview modelini de kullanıma açtı; bu model California Üniversitesi'nin değerlendirme platformu LMArena'da "metin çözümleme" alanında 6. sırada yer aldı.

Parametre sayısındaki artış veri kapasitesini yükseltse de, bunun beraberinde daha fazla hesaplama gücü ve maliyet gerektirdiği vurgulanıyor.

Çin'de Yapay Zeka Rekabeti Hızlandı

Bu yıl Çin merkezli şirketlerin açık kaynak modellerdeki atılımları, ülkedeki yapay zeka sektöründeki yoğun rekabeti gösteriyor. High-Flyer Quant destekli DeepSeek'in R1 modeli 20 Ocak'ta piyasaya sürülmüş; düşük maliyetle geliştirdiği bu açık kaynak model kısa sürede yoğun kullanım görmüş ve uygulama mağazalarında ABD merkezli ChatGPT'yi geride bırakarak en çok indirilen yapay zeka uygulaması olmuştu.

DeepSeek'in düşük bütçeyle geliştirdiği modelin büyük rakiplerini geride bırakması teknoloji dünyasında yankı uyandırdı; bazı gözlemciler bu dönemi ABD–Çin yapay zeka rekabetinde bir "Sputnik anı"na benzetti.

Alibaba'nın Qwen3-Next duyurusu, Çin'in yapay zeka alanındaki hızlı ilerleyişini ve maliyet-etkin performans arayışını bir kez daha gündeme taşıdı.