菲洛嘉青春动能素135HA FILLMED® NCTF 135HA LED指示灯的常见故障分析 智微智能 Elkhartlake K075终端,零售产业新选择 天空蓝拓客管理系统详细介绍版 muso公链项目 天使计划 是什么?[秘] 独家揭秘最前沿的家装“黑科技”——掌赋 天博体育欧洲杯特辑,东道主法兰西的失意2016 亚马逊的送货侦察员 学习听起来像挡泥板 Google Comics Factory使ML变得容易 笑着说-男性或女性 Amazon Rekognition中更好的人脸检测 关于Spaun的真相-大脑模拟 两个聊天机器人彼此聊天-有趣又怪异 GANPaint:将AI用于艺术 WCF和WF给予社区 从耳朵到脸 所有神经网络的深层缺陷 蠕虫在尾巴上平衡杆子 Kickstarter上的OpenCV AI套件 TensorFlow-Google的开源AI和计算引擎 众包取代新闻工作者 Google的DeepMind学会玩街机游戏 哑机器人V智能机器人 .NET与.NET 5融为一体 Google的深度学习-语音识别 LInQer将.NET LINQ移植到Javascript 机器人TED演讲-新的图灵测试? GAN的发明者加入苹果 您的智能手机会监视您键入的内容 人工智能帮助改善国际象棋 Zalando Flair NLP库已更新 TensorFlow 1.5包含移动版本 AlphaGo输了一场比赛-比分3-1 虚拟机器学习峰会 Microsoft开源AI调试工具 SharePoint走向移动 F#4.0发出文化变革的信号 克里斯蒂拍卖AI艺术品 人工智能如何区分 Facebook在蒙特利尔的新AI实验室 Mozilla想要您的声音 微软使用极深的神经网络赢得ImageNet 建立AI合作伙伴关系 .NET Core 3-Microsoft几乎回到了起点 神经网络-更好的销售商? Google使用AI查找您的住所 虹膜-适用于Android的Siri证明苹果没有优势 TensorFlow 2提供更快的模型训练 深度学习研究人员将为Google工作
您的位置:首页 >大数据 >

Lucida个人人工智能

密歇根大学的研究人员组成的Clarity Labs团队去年以发布自己的称为Sirius的IPA(智能个人助理)而成为头条新闻。Sirius被许多人误认为是Apple Siri的开源版本,但事实并非如此,因为这两个项目完全无关。也许这是将Siriusas Lucida重命名的原因之一。

正如核心团队成员Jeremy Russell所说:

Sirius刚开始时,它只是一个事后研究的原型,用于研究哪种硬件平台最适合IPA(智能个人助理),一旦决定专注于AI,重新命名似乎是个好主意。平台本身

为了完全理解该陈述,需要一点历史。最初,Sirius项目的建立是为了促进基准测试和将研究扩展到未来的服务器架构中,这些架构可以处理支持机器学习即服务的Cloud平台的天文工作负载,所有IPA(Apple的Siri,Google的Google Now,Microsoft的Cortana或亚马逊的Echo)依托于此。

随着当前数据中心架构达到其计算极限,Sirius提出了一个全新的主张。为了使数据中心能够继续工作,而不必扩大硬件上的堆叠,他们可以利用高度优化的专用算法来做到这一点。

但是,Lucida的目标不只是此,而且超越了Sirius的成就。它建立在Sirius的基础上,已经发展成为下一代,具有模块化和可扩展性的更智能的一代。

它仍然是语音识别,图像匹配,自然语言处理和问答服务的提供商,但是由于新发现的模块化,它现在可以支持其所有或任何主要组件,即自动语音识别(ASR),图像匹配(IMM)或问题解答系统(QA),将通过定制组件进行修改或完全替换。

例如,假设研究人员想出了自己的语音识别引擎,他现在可以用自己的语言来替换Lucida的ASR组件,以便他仍然可以利用Lucida的其余后端组件。或者,在另一种可能对图像匹配组件不感兴趣的情况下,他可以将其删除并使用Lucida的裸露版本。尝试用一个句子描述Lucida的工作流程是:

Lucida使用语音或图像形式的查询,并使用自然语言形式的答案,就像将任务分配给人类助手一样。

在以下宣传视频中可以很好地证明这一事实,在该宣传视频中,操作员与Lucida驱动的平板电脑进行了交谈,并用自然语言问了一系列问题:

詹姆斯·邦德的作者是谁?得到伊恩·弗莱明的回信

接下来的两个问题

Google何时进行IPO?(!)

其次是

谁发明了花生酱?

突出说明引擎在解释领域不可知问题时的敏捷性。

但是还有更多,因为视频的令人震惊的时刻尚未到来,当研究人员向露西达展示比萨斜塔的照片并询问其高度时。对于任何计算机而言,这都是一项艰巨的任务,因为它首先必须识别建筑物,分析和理解语音请求,然后将其转换为后端数据库可以理解的格式,然后检索答案并以自然语言将其重组为用户了解。我们已经探索了这样一种方法,在这种方法中,飞行员可以通过人类理解的语言与AI Wingman进行交流和协调,这是在空战中至关重要的工具。

从技术上讲

Lucida由三个独立且独立的组件融合而成:

自动语音识别(ASR)组件利用高斯混合模型和/或深度神经网络评分,由信号处理深度神经网络后端支持,并支持多种语音识别工具包:Kaldi(基于深度神经网络的隐马尔可夫模型),Pocketsphinx和Sphinx4(基于高斯混合模型的隐马尔可夫模型)。

图像匹配(IMM)组件利用了特征提取(FE)和特征描述(FD)技术,由图像处理DNN后端提供支持,并使用SURF(一种OpenCV计算机视觉和机器学习软件库),用于从图像中提取加速的鲁棒特征并将其用作对数据库的查询。

问题解答系统(QA)(正则表达式/正则表达式,Porter词干/词干和条件随机字段/ CRF标记)由自然语言处理DNN后端提供支持,并使用Java平台独立框架OpenEphyra问题解答,以及以Lemur的Indri格式存储的Wikipedia数据库。这是Lucida如何回答“比萨斜塔有多高”的问题;它在嵌入式Wikipedia数据库中进行了查找。

这些DNN后端以及7个依赖于应用程序的后端在DjINN和Tonic套件中形成了“深度学习即服务”框架。

因此,Tonic套件是接受一系列任务的应用程序的集合

图像处理相关任务:

•图像分类(IMC)•面部识别(FACE)•数字识别(DIG)

语音处理相关任务:

•自动语音识别(ASR)

自然语言处理相关任务:

•词性标记(POS)•分块(CHK)•名称实体识别(NER)

全部源自用户提供的查询。

然后,应用程序调用DNN Web服务以将其转发给请求,然后从那里接收请求,处理请求并以自然语言格式进行答复。

该系统的灵活性在于您可以混合和匹配这些服务以开发流水线式应用程序。例如,您可以将ASR和QA服务或所有ASR + IMM + QA组合在一起,例如为餐厅和餐厅拍照。问Lucida这家餐厅什么时候关闭,以便Lucida及时在8点回复。

您可以轻松地看到结果。可穿戴设备或移动设备与所有者之间有更亲密的关系,了解他们的秘密,习惯和财产,因此他们不仅能够回答一般性问题,例如最近的地铁站在哪里,而且个人问题也能回答,例如我要多少磅车顶架固定住吗?,根据宣传视频,还是典型的,可能挽救生命的内容,例如我妻子的生日问题(双关语)。

当然,隐私和安全性方面是所有物联网设备都面临的一个重大问题,直到今天,它仍未完全令人满意(尽管比特币的区块链基础设施看起来像是握住了钥匙,但这是另一个话题) 。

从今天开始,Lucida将作为云平台提供给世界,就像IBM Watson Developer云和Hewlett Packard的Haven OnDemand(由密歇根大学和Clinc专门为这个事业而成立)提供的一样。

这里的想法是将API暴露给DNN后端,这将使任何人都可以通过此举来创建智能的Personal Assistant应用程序,以强调我们这个时代的新兴趋势;机器学习和AI已达到可交易商品的地位。主要利益相关者之间的竞争看起来很凶...

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。