RSS Slashdot

DeepSeek beschleunigt Zeitplan für KI-Modelle, während Markt auf kostengünstigen Durchbruch reagiert

Das chinesische KI-Startup DeepSeek beschleunigt die Veröffentlichung seines R2-Modells nach dem Erfolg seines R1-Modells, das viele US-Konkurrenten bei niedrigeren Kosten übertraf und einen Marktverkauf auslöste. Das R2-Modell verspricht verbesserte Codierfähigkeiten und Vernunft in mehreren Sprachen jenseits des Englischen. Die Muttergesellschaft von DeepSeek, High-Flyer, investierte frühzeitig in Rechenleistung, einschließlich zweier Supercomputer-Cluster, was dem Unternehmen einen Wettbewerbsvorteil verschafft. Der zweite Cluster, Fire-Flyer II, besteht aus etwa 10.000 Nvidia-A100-Chips. Die Kosteneffizienz von DeepSeek resultiert aus innovativen Architekturwahl wie Mixture-of-Experts und multihead latenter Aufmerksamkeit. Die Preisgestaltung des Unternehmens ist 20-40 Mal günstiger als die von OpenAI äquivalenten Modellen, laut Analysten von Bernstein. Der Wettbewerbsdruck hat bereits dazu geführt, dass OpenAI die Preise senkte und ein skalierbares Modell veröffentlichte. Google's Gemini hat auch diskontierte Zugangsstufen eingeführt, um auf die wettbewerbsfähige Preisgestaltung von DeepSeek zu reagieren. Das R1-Modell von DeepSeek wurde im Januar veröffentlicht und sollte ursprünglich im Mai vom R2-Modell gefolgt werden, aber das Unternehmen will es jetzt so schnell wie möglich veröffentlichen. Der Erfolg von DeepSeeks Modellen hat eine signifikante Marktreaktion ausgelöst, mit einem Marktverkauf von über 1 Billion Dollar.
favicon
bsky.app
AI and ML News on Bluesky @ai-news.at.thenote.app
favicon
slashdot.org
DeepSeek Accelerates AI Model Timeline as Market Reacts To Low-Cost Breakthrough
Create attached notes ...