Inferenz-Engine entscheidet über Durchsatz, Latenz und Stabilität großer Sprachmodelle unter Last. Ein praxisnaher Benchmark vergleicht die drei Werkzeuge.