AIモデルの評価 MMLU – 大規模マルチタスク言語理解ベンチマーク MMLUは、幅広い知識領域にわたるAIモデルの包括的な理解力と推論能力を評価するために使用される、大規模なマルチタスク言語理解ベンチマークです。