DSpark: Deepseek verbessert mit Token-Raten die GPU-Auslastung

Wait 5 sec.

Spekulative Decodierung ermöglicht, GPUs deutlich besser auszulasten. Die Qualität der Ausgaben bleibt gleich, Deepseek nutzt Dspark bereits produktiv. Von Johannes Hiltscher (KI, Wissenschaft)