DeepSeek veröffentlicht V4 mit einem Kontextfenster von einer Million Token
Das chinesische KI-Labor DeepSeek hat ein neues Sprachmodell unter dem Namen DeepSeek-V4 veröffentlicht, das laut Unternehmensangaben ein Kontextfenster von einer Million Token unterstützt. Ermöglicht wird dies durch zwei neue Aufmerksamkeitsmechanismen, die den Speicherbedarf erheblich reduzieren sollen.