Üst

DeepSeek - Yapay Zeka ile Desteklenen Bir Teknoloji ve Yenilik Harikası

  • Konuyu Başlatan Konuyu Başlatan Ugur
  • Başlangıç tarihi Başlangıç tarihi
DeepSeek, Çinli bir yapay zeka şirketi (yapay zeka laboratuvarı) ve aynı zamanda geniş dil modeli tabanlı sohbet ajanının adıdır. Şirketin merkezi Hangzhou, Zhejiang'da bulunmakta olup, Çinli hedge fonu High-Flyer tarafından kurulmuş ve finanse edilmiştir. Şirketin kurucusu ise Liang Wenfeng'dir.

deepseek.webp
deepseek.webp


2025'in başlarında DeepSeek, MIT lisansı altında açık kaynak olarak yayımlanan yeni bir modelini tanıttı. Performansı, hatta bazı alanlarda lider Amerikan modellerini aşan bu model, düşük geliştirme maliyeti ve kaynak kullanımında etkinliği ile dikkat çekmektedir. Bu yeni modelin yayımlanması, finans piyasalarında önemli bir yankı uyandırmış, özellikle yapay zeka için grafik işlemciler üreten küresel lider Nvidia gibi Amerikan şirketlerinin hisse senetlerinde keskin düşüşlere yol açmıştır.

Tarihçe​

Nisan 2023’te, High-Flyer hedge fonu kurucusu Liang Wenfeng, yüksek frekanslı ticarette yapay zeka modellerini kullanan bir sistem üzerinde çalıştığını ve bu bağlamda bağımsız bir yapay zeka şirketi olan DEEPSEEK’i kurduklarını duyurdu. Şirketin amacı, geniş dil modellerini kullanarak genel yapay zeka çözümleri geliştirmek ve bu çözümleri ticarileştirmekti.

Kasım 2023’te, DEEPSEEK ilk modelini, DeepSeek Coder’ı piyasaya sürdü. Bu model, kod üretimi ve kaynak kodları anlama konularında uzmanlaşmıştı. Aynı yılın 29 Kasım’ında şirket, 67 milyar parametreye sahip ilk geniş dil modeli tabanlı sohbet ajanı olan DeepSeek LLM’yi tanıttı. Bu model ücretsiz ve açık kaynaklı olarak sunuldu.

Mayıs 2024’te DEEPSEEK, 236 milyar parametre içeren ve her bir token kullanımında 21 milyar parametreye kadar etkinleştirebilen DeepSeek-V2’yi piyasaya sürdü. Bir ay sonra, geliştirilmiş bir kodlama modeli olan DeepSeek-Coder-V2 tanıtıldı.

Aralık 2024’te DEEPSEEK, mevcut modellerin yerini almak üzere tasarlanan ve çevrimiçi diğer dil modellerine Çinli bir alternatif sunmayı hedefleyen DeepSeek-V3’ü yayımladı.

20 Ocak 2025'te şirket, ilk akıl yürütme modeli olan DeepSeek-R1'i duyurdu. Bu model, sorgulara ardışık mantıksal adımlar geliştiren bir akıl yürütme zinciri kullanmaktadır. MIT lisansı altında kaynak koduyla birlikte yayınlanan model, yalnızca milyonlarca dolarlık geliştirme maliyetiyle (milyarlarca dolar veya euro yerine) yapay zeka sektörünü kökten değiştirdi. Performans açısından sektörün en iyi oyuncularıyla karşılaştırılabilir seviyedeyken, hesaplama kaynaklarını çok daha düşük bir seviyede tüketmektedir. Teknolojinin varsayılan kârlılığı karşısında, yapay zeka alanındaki bazı büyük şirketlerin (örneğin NVIDIA) borsa değerleri büyük ölçüde düşüş göstermiştir.
 
Semerkant Kâğıdı
Karadedeler Olayı
Ugur
Geri