Şirketin WeChat hesabından yapılan açıklamada, "Qwen 2.5-Max" adı verilen versiyonunun, Microsoft destekli OpenAI'ın "GPT-4o", Facebook'un çatı şirketi Meta'nın geliştirdiği Llama 3.1 gibi modellerin yanı sıra DeepSeek'in V3 modelinden daha iyi performans gösterdiği aktarıldı.
Çinli şirket DeepSeek, geliştirdiği düşük maliyetli Büyük Dil Modeli (LLM) ile ABD'li şirketlerin hakim olduğu sektörde sarsıntıya yol açmıştı.
Alibaba'nın modelin yeni versiyonunu, Çin'de tatil olan Bahar Bayramı'nın ilk gününde piyasaya sürmesi, DeepSeek'in başarısının yalnızca Amerikan şirketlerini değil Çin'deki sektör devlerini de yapay zeka modellerini geliştirme baskısı altında bıraktığını gösteriyor.
Şirket paylaşımında Qwen 2.5-Max'ın bilgi işlem, programlama, bütünleşik kapasitelerin kapsamlı değerlendirmesi ve insan tercihlerine uyum testlerinde açık kaynaklı muadillerinden daha başarılı olduğu, Amazon destekli Claude-3.5-Sonnet'e yakın performans gösterdiği aktarıldı.
Çinli şirket DeepSeek'in düşük bir bütçeyle geliştirdiği "DeepSeek V3" adlı modelin, ABD'de büyük yatırımlarla geliştirilen muadillerinden daha iyi performans sergilemesi Amerikan teknoloji şirketlerinin hisselerinin değer kaybetmesine yol açmıştı.
Yorumcuların dikkatine… • İmlası çok bozuk, • Büyük harfle yazılan, • Habere değil yorumculara yönelik, • Diğer kişilere hakaret niteliği taşıyan, • Argo, küfür ve ırkçı ifadeler içeren, • Bir iki kelimelik, konuyu zenginleştirmeyen, yorumlar KESİNLİKLE YAYIMLANMAYACAKTIR. |
Bunlar da ilginizi çekebilir...