
摘要
自动语言识别是一项具有挑战性的任务,尤其在区分语系相近的语言时更为困难。本文提出一种机器学习方法,用于北欧诸语言的自动语言识别,这些语言常被现有的先进工具误分类。具体而言,本文重点研究六种北欧语言之间的区分:丹麦语、瑞典语、挪威语(新挪威语)、挪威语(书面语)、法罗语和冰岛语。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| language-identification-on-nordic-langid | FastText | Accuracy: 0.9711 |

自动语言识别是一项具有挑战性的任务,尤其在区分语系相近的语言时更为困难。本文提出一种机器学习方法,用于北欧诸语言的自动语言识别,这些语言常被现有的先进工具误分类。具体而言,本文重点研究六种北欧语言之间的区分:丹麦语、瑞典语、挪威语(新挪威语)、挪威语(书面语)、法罗语和冰岛语。
| 基准 | 方法 | 指标 |
|---|---|---|
| language-identification-on-nordic-langid | FastText | Accuracy: 0.9711 |