Word Sense Disambiguation On Big Bench

Accuracy

评测结果

各个模型在此基准测试上的表现结果

		Paper Title
Chinchilla-70B (few-shot, k=5)	69.1	Training Compute-Optimal Large Language Models
Gopher-280B (few-shot, k=5)	56.4	Scaling Language Models: Methods, Analysis & Insights from Training Gopher
OPT 175B	49.1	Galactica: A Large Language Model for Science
GAL 120B (few-shot, k=5)	48.7	Galactica: A Large Language Model for Science
GAL 30B (few-shot, k=5)	47.0	Galactica: A Large Language Model for Science
BLOOM 176B	1.3	Galactica: A Large Language Model for Science

0 of 6 row(s) selected.