Çinli teknoloji şirketi DeepSeek, yapay zeka alanındaki büyük atılımıyla gündemde. Hedge fon milyarderi Liang Wenfeng tarafından kurulan şirket, 20 Ocak’ta tanıttığı R1 modelini duyurdu. Bu model, insan denetimi olmadan kendi kendine öğrenebilen ve gelişen bir yapay zeka platformu olarak dikkat çekiyor. DeepSeek, ChatGPT’yi geride bırakıp, Apple App Store’da zirveye yerleşti.
DeepSeek nedir?
DeepSeek, Çin merkezli bir yapay zeka araştırma laboratuvarıdır ve açık kaynaklı büyük dil modelleri (LLM) geliştirmeye odaklanmaktadır. Şirket, 2023 yılında, daha önce High-Flyer adlı hedge fonunu kuran ve yöneten Liang Wenfeng tarafından kurulmuştur. High-Flyer, yapay zeka tabanlı ticaret algoritmaları geliştirmesiyle tanınan bir hedge fonudur.
DeepSeek'in bu başarısı, Çin’in yapay zeka alanında ABD'nin yaptırımlarına rağmen gösterdiği ilerlemeyi simgeliyor. ABD, geçtiğimiz yıllarda Nvidia'nın en güçlü çiplerinin Çin'e ihracatını yasaklamıştı. Bu durum, Çinli yapay zeka şirketlerinin, sınırlı sayıda yerel çipi en verimli şekilde kullanmak için yenilikçi çözümler geliştirmesini zorunlu kıldı.
Reuters'ın haberine göre, Çin, ABD’nin H100 çiplerini ithal edemediği için, yerine daha düşük veri aktarım hızlarına sahip H800 çiplerini kullanıyor. Buna rağmen DeepSeek, sınırlı kaynaklarla önemli bir başarıya imza attı.
DeepSeek’in Düşük Maliyetli Modeli Büyük İlgi Topladı
DeepSeek mühendisleri, düşük maliyetli Nvidia H800 çipleriyle büyük bir başarıya imza attıklarını açıkladı. Şirket, 671 milyar parametreli bir yapay zeka modelini eğitmek için yalnızca 5,6 milyon dolar harcadı. Bu maliyet, OpenAI ve Google gibi teknoloji devlerinin benzer büyüklükteki modelleri eğitmek için harcadıkları tutarın çok altında.
ABD, yapay zeka yatırımlarına büyük bütçeler ayırarak bu alanda liderlik iddiasını sürdürüyor. Başkan Donald Trump döneminde, Amerika, önümüzdeki dört yıl içinde yapay zeka altyapısına 500 milyar dolar harcamak için bir ortak girişim başlatmıştı. Ancak DeepSeek'in az kaynakla büyük bir başarıya ulaşması, Çin’in ABD'nin bu alandaki liderliğini tehdit edebileceğini gösteriyor.
DeepSeek'in Başarısının Küresel Etkisi
DeepSeek’in R1 modelini duyurması, dünya genelinde büyük yankı uyandırdı. Bu gelişmenin ardından, ABD hisse senedi vadeli işlemleri ve Çin dışındaki Asya hisseleri, DeepSeek’in ücretsiz ve açık kaynaklı yapay zeka modelinin etkilerini değerlendirmek için düşüş yaşadı.
Meta ve OpenAI'nin sözcüleri ise konuya ilişkin henüz bir açıklama yapmadı.