Spekulative Decodierung ermöglicht, GPUs deutlich besser auszulasten. Die Qualität der Ausgaben bleibt gleich, Deepseek nutzt Dspark bereits produktiv. Von Johannes Hiltscher (KI, Wissenschaft)