Führende große Sprachmodelle erzielen in medizinischen Tests bessere Ergebnisse als spezialisierte kleine Modelle. Das zeigt eine Studie.