HyperAIHyperAI

Command Palette

Search for a command to run...

基于大规模弱监督的鲁棒语音识别

Radford Alec ; Kim Jong Wook ; Xu Tao ; Brockman Greg ; McLeavey Christine ; Sutskever Ilya

摘要

我们研究了仅训练用于预测互联网上大量音频转录文本的语音处理系统的性能。当扩展到68万小时的多语言和多任务监督时,所得到的模型在标准基准测试中表现出良好的泛化能力,并且在零样本迁移设置下通常能够与先前完全监督的结果相媲美,而无需任何微调。与人类相比,这些模型在准确性和鲁棒性方面接近人类水平。我们将发布模型和推理代码,以作为进一步研究稳健语音处理的基础。


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供