PrfaaS: Cross-Datacenter-Architektur soll LLM-Betriebskosten deutlich reduzieren 20.04.2026 Forscher von Moonshot AI und der Tsinghua-Universität haben eine neue Infrastrukturarchitektur namens PrfaaS vorgestellt, die … Weiterlesen »
NVIDIA KVPress: Effizientere Speichernutzung beim Einsatz großer Sprachmodelle 11.04.2026 NVIDIA hat mit KVPress ein Open-Source-Framework veröffentlicht, das den Speicherbedarf bei der Inferenz von Large … Weiterlesen »