
摘要
受显性人类记忆系统认知科学理论的启发,我们构建了一个具有短期记忆、情景记忆和语义记忆系统的智能体模型,每个记忆系统均采用知识图谱进行建模。为了评估该系统并分析智能体的行为,我们设计并发布了自己的强化学习智能体环境——“房间”(The Room),在这个环境中,智能体需要学会如何编码、存储和检索记忆以通过回答问题来最大化其回报。实验结果表明,基于深度Q学习的智能体成功学会了短期记忆是否应该被遗忘,或者应将其存储在情景记忆或语义记忆系统中。我们的实验还指出,在该环境中,具备类似人类记忆系统的智能体可以优于没有这种记忆结构的智能体。
代码仓库
humemai/agent-room-env-v1
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| roomenv-v1-on-roomenv-v1 | HumemAI-v0-capacity=32-semantic-scratch | final agent reward: 109 |
| roomenv-v1-on-roomenv-v1 | HumemAI-v0-capacity=32-semantic-pretrained | final agent reward: 116.5 |