3 个月前

苹果公司用于短字符串语言识别的双向LSTM模型复现

苹果公司用于短字符串语言识别的双向LSTM模型复现

摘要

语言识别是指确定文档所使用语言的任务。在自动拼写检查器选择等应用场景中,语言识别需处理极短的文本片段,例如短信内容。在本研究中,我们复现了苹果公司在一篇博客文章中简要描述的语言识别架构。实验结果证实了双向LSTM(bi-LSTM)模型的有效性,并发现其性能优于当前现有的开源语言识别工具。此外,我们进一步发现,该模型在语言识别上的错误主要源于语义或结构相近语言之间的混淆。

代码仓库

AU-DIS/LSTM_langid
官方
pytorch

基准测试

基准方法指标
language-identification-on-opensubtitlesApple bi-LSTM
Accuracy: 91.37
language-identification-on-universalApple bi-LSTM
Accuracy: 86.93

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
苹果公司用于短字符串语言识别的双向LSTM模型复现 | 论文 | HyperAI超神经