マルチタスク学習 - ResoHub

MMLU – 大规模多任务语言理解基准

AIモデルの評価 MMLU – 大規模マルチタスク言語理解ベンチマーク

MMLUは、幅広い知識領域にわたるAIモデルの包括的な理解力と推論能力を評価するために使用される、大規模なマルチタスク言語理解ベンチマークです。