KI-Modellbewertung MMLU – Benchmark für groß angelegtes Multitasking-Sprachverständnis MMLU ist ein umfangreicher Multitasking-Benchmark für das Sprachverständnis, der zur Bewertung der umfassenden Verständnis- und Schlussfolgerungsfähigkeiten von KI-Modellen in einer Vielzahl von Wissensbereichen verwendet wird.