首页 > 科技周边 > 人工智能

Meta AI大模型能识别4000多种语言，称错误率仅有OpenAI产品的一半

来源：搜狐

时间：2023-05-30 09:06:58 295浏览收藏

学习科技周边要努力，但是不要急！今天的这篇文章《Meta AI大模型能识别4000多种语言，称错误率仅有OpenAI产品的一半》将会介绍到等等知识点，如果你想深入学习科技周边，可以关注我！我会持续更新相关文章的，希望对大家都能有所帮助！

Meta 宣布，自己已经建立了新的人工智能模型，可以识别和产生 1000 多种语言的语音——比目前可用的模型增加了 10 倍。该公司表示，这是朝着传承有失传风险的语言迈出的重要一步。

Meta 正在通过 GitHub 向公众发布其模型。它声称，开源这些模型将帮助使用不同语言的开发人员构建新的语音应用程序——比如可以明白每个人所说语言的消息传递服务，或者可以用于任何语言的虚拟现实系统。

世界上大约有 7000 种语言，但现有的语音识别模型却只覆盖了其中的大约 100 种语言。由于此类模型通常需要许多已标注的训练数据，而这些数据仅适用于少数语言，如英语、西班牙语和中文。

Meta 的研究人员通过重新训练该公司在 2020 年开发的一种现有的人工智能模型，从而解决了这个问题，该模型能够从音频中学习语音模式，而不需要大量的标记数据，比如转录后的文字记录。

Meta AI大模型能识别4000多种语言，称错误率仅有OpenAI产品的一半（来源：STEPHANIE ARNETT/MITTR | ENVATO）

他们对两组新数据集进行了训练：一套包含《圣经·新约》的录音，以及来自互联网上的 1107 种语言的圣经对应文本，另一组包含 3809 种语言的未标记的圣经录音。首先，该团队对语音和文本数据进行处理以提高其质量，之后应用一种算法，实现音频记录与对应文本的对齐。然后，他们用新对齐的数据训练另一种算法。这种方法使得研究人员可以更容易地训练算法学习一种新的语言，即使没有相关的文本数据。

“我们可以利用这个模型学到的东西，用非常非常少的数据快速构建语音系统，”担任该项目的研究科学家的迈克尔·奥利（Michael Auli）说。”

“对于英语，我们有很多很多好的数据集，但对于一些语言而言，我们可能找不到 1000 个使用者，我们拿不到好用的的数据集。”

研究人员表示，他们的模型可以转换 1000 多种语言，但能识别 4000 多种语言。

他们将这些模型与包括 OpenAI Whisper 在内的竞争对手的模型进行了比较，并声称它们的错误率只有竞品的一半，尽管 Meta 覆盖的模型是竞品的 11 倍。

然而，该团队警告说，该模型仍然存在误译某些单词或短语的风险，这可能导致不准确或潜在的冒犯性标注。他们承认他们的语音识别模型存在更多偏见词汇，但较其他模型仅多出0.7%。

研究非洲语言自然语言处理的克里斯·艾姆祖（Chris Emezue）表示，虽然这项研究的广度令人印象深刻，但使用宗教文本来训练人工智能模型可能存在争议。他没有参与这个项目。

支持：Ren

原文：

https://www.technologyreview.com/2023/05/22/1073471/metas-new-ai-models-can-recognize-and-produce-speech-for-more-than-1000-languages/

以上就是本文的全部内容了，是否有顺利帮助你解决问题？若是能给你带来学习上的帮助，请大家多多支持golang学习网！更多关于科技周边的相关知识，也可关注golang学习网公众号。

声明：本文转载于：搜狐如有侵犯，请联系study_golang@163.com删除