Open-Source-KI - BYTEWIRE AI

DeepSeek kündigt nächste Modellgeneration an – mit Fokus auf Coding und chinesische Hardware

admin / 25.04.2026

Rund ein Jahr nach dem Aufsehen um Modell R1 hat das chinesische KI-Unternehmen DeepSeek eine Vorschau auf sein nächstes großes Sprachmodell veröffentlicht. DeepSeek V4 soll laut eigenen Angaben mit den führenden geschlossenen Systemen von Anthropic, Google und OpenAI konkurrieren – und erscheint erneut als Open-Source-Modell.

Open-Source-KI, wt

DeepSeek V4: Chinesisches Open-Source-Modell holt bei Reasoning-Benchmarks deutlich auf

admin / 24.04.2026

DeepSeek hat mit V4 ein neues Large Language Model angekündigt, das nach eigenen Angaben die Leistungslücke zu den führenden proprietären Frontier-Modellen spürbar verringert. Das Modell soll dabei effizienter und leistungsfähiger sein als sein Vorgänger DeepSeek V3.2 – und das bei weiterhin offenem Quellcode.

Open-Source-KI, wt

DeepSeek V4: Chinesisches KI-Labor veröffentlicht bislang größtes Open-Weights-Modell mit wettbewerbsfähiger Preisgestaltung

admin / 24.04.2026

Das chinesische KI-Labor DeepSeek hat mit V4-Pro und V4-Flash zwei neue Modelle veröffentlicht, die sowohl in der Modellgröße als auch beim Preis neue Maßstäbe setzen. Mit bis zu 1,6 Billionen Parametern übertrifft DeepSeek V4-Pro alle bisher öffentlich verfügbaren Open-Weights-Modelle – und liegt preislich deutlich unter den vergleichbaren Angeboten von OpenAI, Google und Anthropic.

Open-Source-KI, wt

Hugging Face automatisiert LLM-Training mit Open-Source-Agent

admin / 22.04.2026

Hugging Face hat mit „ml-intern” einen Open-Source-Agenten veröffentlicht, der den Post-Training-Workflow von Large Language Models weitgehend automatisiert. Das Tool soll den bislang aufwändigen manuellen Prozess des Modell-Finetunings erheblich vereinfachen und auch kleineren Teams ohne spezialisierte ML-Infrastruktur zugänglich machen.

Open-Source-KI, wt

OpenMythos: Open-Source-Implementierung schlägt größere Transformer-Modelle mit 770 Millionen Parametern

admin / 20.04.2026

Eine neue Open-Source-Implementierung namens OpenMythos rekonstruiert die Architektur von Anthropics Claude-Mythos-Modell in PyTorch – und erzielt dabei mit lediglich 770 Millionen Parametern Ergebnisse, die mit deutlich größeren Transformer-Modellen vergleichbar sind. Das Projekt richtet sich an Forscher und Entwickler, die effiziente Sprachmodelle ohne proprietäre Beschränkungen einsetzen wollen.

Open-Source-KI, wt

Alibaba erweitert Qwen3-Familie: Neues Open-Source-Modell setzt auf selektive Parameteraktivierung

admin / 17.04.2026

Alibaba hat mit dem Qwen3.6-35B-A3B ein weiteres Modell seiner Qwen3-Serie veröffentlicht. Das Open-Source-Modell verfügt über 35 Milliarden Parameter, aktiviert davon im Betrieb jedoch nur drei Milliarden – ein Ansatz, der Rechenaufwand und Kosten deutlich reduziert, ohne dabei auf Leistungsfähigkeit zu verzichten.

Open-Source-KI, wt

Alibabas Qwen-Team veröffentlicht effizientes Vision-Language-Modell mit Sparse-MoE-Architektur

admin / 17.04.2026

Das Qwen-Team von Alibaba hat mit Qwen3.6-35B-A3B ein neues Open-Source-Modell vorgestellt, das trotz 35 Milliarden Gesamtparametern lediglich 3 Milliarden Parameter aktiv nutzt. Die Sparse-Mixture-of-Experts-Architektur (Sparse MoE) soll damit eine deutlich ressourcenschonendere Inferenz ermöglichen, ohne wesentliche Leistungseinbußen in Kauf nehmen zu müssen.

Open-Source-KI, wt

Google veröffentlicht Gemma 4: Multimodales Open-Source-Modell unter Apache-Lizenz

admin / 16.04.2026

Google hat die vierte Generation seiner Gemma-Modellfamilie unter der Apache-2.0-Lizenz veröffentlicht. Die neuen Modelle unterstützen multimodale Eingaben und sind explizit auf agentische Anwendungsfälle ausgelegt – ein Signal, das die Bedeutung quelloffener KI-Infrastruktur im Unternehmensumfeld weiter unterstreicht.

Open-Source-KI, wt

Gemma 4 mit Claude-Opus-Verhalten: Open-Source-Modell erhält Enterprise-Fine-Tune

admin / 15.04.2026

Ein Entwickler hat Googles quelloffenes Sprachmodell Gemma 4 mit dem Verhaltensmuster von Anthropics Claude Opus kombiniert – und damit ein lokal betreibbares Modell geschaffen, das Eigenschaften proprietärer Frontier-Modelle in die eigene Infrastruktur bringt.

Open-Source-KI, wt

MiniMax M27: Lizenzänderung nach Veröffentlichung wirft Fragen zur Open-Source-Verlässlichkeit auf

admin / 13.04.2026

Das chinesische KI-Labor MiniMax hat mit dem Modell M2.7 einen leistungsstarken Agenten-Ansatz vorgestellt, der auf wichtigen Coding-Benchmarks mit Anthropics Claude Opus konkurriert. Kurz nach der Veröffentlichung der Modellgewichte auf der Plattform Hugging Face änderte MiniMax jedoch still und ohne gesonderte Ankündigung die Lizenzbedingungen – ein Vorgang, der in der Open-Source-Community erhebliche Aufmerksamkeit erregt hat.