Mozilla想要您的声音 微软使用极深的神经网络赢得ImageNet 建立AI合作伙伴关系 .NET Core 3-Microsoft几乎回到了起点 神经网络-更好的销售商? Google使用AI查找您的住所 虹膜-适用于Android的Siri证明苹果没有优势 TensorFlow 2提供更快的模型训练 深度学习研究人员将为Google工作 Xamarin SDK开源 更正工具已添加到Google网站翻译器中 使用AI进行双检测 DARPA的AI下一步运动-20亿美元! AI在DARPA混战中击败了人类飞行员 Rodney Brooks称AI的状态 Arduino体内的蠕虫意识 深度学习找到您的照片 更多的机器学习应用于Google表格 深度天使-未来媒体操纵的AI ASP.NET更新并重命名 小猫猫猫探测器 .NET Jupyter笔记本宣布 介绍DeepSpeech 在Formula Pi中竞赛A YetiBorg Google开源准确解析器-Parsey McParseface 适用于我们的REST的MIcrosoft的Project Oxford AI API Eyeshot,.NET的CAD控件 百度AI团队被骗-被ImageNet竞赛禁赛一年 GIMP的机器学习Python插件 Google的自动驾驶汽车-不是​​那么聪明吗? 设计自己的无人驾驶汽车 开源深度学习框架如何堆叠? Azure机器学习服务上线 Evi重载 Microsoft R Server 9.1添加了ML增强功能 廉价的十亿个神经元联系 Skype转换器突破了语言障碍 ASIMO庆祝成立10周年 Google翻译超过2亿 .NET Core 3获取GUI Google开始为Prediction API收费 Google文档获取基于AI的语法检查器 Microsoft认知工具包版本2.0 Google的DeepMind Files AI专利 ONNX for AI模型的互操作性 机器学习识别MOMA艺术品 音频超分辨率 神经网络聊天机器人-令人惊讶的是人类吗? Microsoft扩展了认知服务API RankBrain-AI进入Google搜索
您的位置:首页 >开发 >

Mozilla想要您的声音

Mozilla推出了Project Common Voice,以众包语音识别。一旦捕获了大量音频数据,其他人就可以在自己的应用程序中使用它们。

ffcvbanner

Project Common Voice的基本原理是,任何类型的机器学习都需要大量数据。在训练语音到文本系统的情况下,大约需要10,000小时,这是目标。使用众包将使Mozilla能够使语音识别技术可供开发人员使用。

Mozilla解释了该项目为何如此重要的原因:

声音是自然的,声音是人的。这是最简单,最自然的交流方式。借助Common Voice,开发人员可以构建惊人的东西-从实时翻译器到启用语音的管理助手。但是,构建这些应用所需的数据尚未公开。Common Voice将为他们提供创新所需的东西。

人工智能的最新革命大部分归功于互联网提供的大量带标签数据数据库,这些数据可以训练神经网络。如果没有语音摘录的数据库以及完整的准确文本转录,就不可能训练神经网络进行语音到文本的翻译。到目前为止,构建这样的数据库需要Google,Amazon,Microsoft和Apple等大公司的资源。相比之下,Mozilla的方法是依靠我们所有人。

该项目依赖捐赠-但这一次是您的声音和所需的聆听技巧。要参与其中,您将需要一个带有麦克风和扬声器的系统,并允许Mozilla访问它们。有一个iOS应用,在我们的桌面测试中,该网络应用可与Firefox无缝运行,拒绝与Edge配合使用,有时与Chrome和在Android上缓慢缓慢地工作。

您可以识别“公共语音”何时响应颜色变化:

commonvoice2

该应用程序要求您说出三个句子,然后让您有机会在提交录音之前对其进行复习。

简历提交

为项目做贡献的另一种方法是验证他人录制的句子,确认您听到的内容与文本相对应。相反,不要期望听到完美的音频:

我们希望音频质量能够反映语音到文本引擎将在野外看到的音频质量。因此,我们要多样化。这教会了语音到文本引擎处理各种情况(背景通话,汽车噪音,风扇噪音)而没有错误

听到别人录制的各种口音很有趣,这提示您完成自己的个人资料,询问您的口音,性别和年龄范围。

由于该项目是开源的,因此也有机会参与其未来的开发并支持Mozilla的使命,Common Voice项目是其最新组成部分:

Mozilla致力于保持网络的开放性并对所有人开放。为此,我们需要通过Common Voice之类的项目来增强Web创作者的能力。随着语音技术的发展超出利基应用的范围,我们相信它们必须平等地为所有用户提供服务。我们认为在构建和测试语音技术时,需要包括更多的语言,口音和人口统计信息。Mozilla希望看到一个健康,充满活力的互联网。这意味着让新创作者可以访问语音数据,以便他们可以构建新的非凡项目。Common Voice将是一个公共资源,将帮助世界各地的Mozilla团队和开发人员。

Common Voice应用程序很有趣,并且很高兴知道您不花时间来为有价值的资源做贡献。

普通话横幅

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。