
摘要
对自然语言的听觉注意力是一个复杂的脑部过程。从生理信号中对其进行量化可以为当前脑机接口系统的改进和应用范围的扩展提供重要价值,但这一任务仍然充满挑战。本文介绍了一组在自然语言听觉注意力实验中收集的生理信号数据集。在该实验中,向25名非母语参与者呈现了不同听觉条件下录制的英语句子作为听觉刺激,并要求他们转录这些句子。实验过程中,从每位参与者身上采集了14通道脑电图、皮肤电反应和光电容积描记图信号。根据正确转录单词的数量,为每个呈现在受试者面前的听觉刺激计算了一个注意力评分。研究发现,注意力评分与听觉条件之间存在显著相关性($p<<0.0001$)。我们还提出了四个涉及所收集数据集的不同预测任务,并开发了一个特征提取框架。每个预测任务的结果均使用基于频谱特征的支持向量机获得,并且优于随机水平。该数据集已公开发布以供进一步研究,并附带了一个Python库——phyaat,以便于预处理、建模及重现本文所述结果。数据集及其他资源可在网页https://phyaat.github.io上获取。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| attention-score-prediction-on-phyaat | SVM | MAE: 29.65 |
| lwr-classification-on-phyaat | SVM | Accuracy: 81 |
| noise-level-prediction-on-phyaat | SVM | MAE: 4.75 |
| semanticity-prediction-on-phyaat | SVM | Accuracy: 56 |