
摘要
鉴于近期在人工智能领域的成功(例如,AlphaGo 在围棋比赛中战胜了李世石),评估人工智能系统距离人类水平的智能有多近变得越来越重要。本文描述了艾伦人工智能科学挑战赛——一种旨在实现这一目标的方法,该方法导致了一场独特的 Kaggle 竞赛,介绍了竞赛的结果、所学到的经验教训以及我们的下一步计划。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| question-answering-on-aristo-kaggle-allen-ai | Alejandro Mosquera | 1:1 Accuracy: 58.26 |
| question-answering-on-aristo-kaggle-allen-ai | Cardal | 1:1 Accuracy: 59.31 |