菲洛嘉青春动能素135HA FILLMED® NCTF 135HA LED指示灯的常见故障分析 智微智能 Elkhartlake K075终端,零售产业新选择 天空蓝拓客管理系统详细介绍版 muso公链项目 天使计划 是什么?[秘] 独家揭秘最前沿的家装“黑科技”——掌赋 天博体育欧洲杯特辑,东道主法兰西的失意2016 亚马逊的送货侦察员 学习听起来像挡泥板 Google Comics Factory使ML变得容易 笑着说-男性或女性 Amazon Rekognition中更好的人脸检测 关于Spaun的真相-大脑模拟 两个聊天机器人彼此聊天-有趣又怪异 GANPaint:将AI用于艺术 WCF和WF给予社区 从耳朵到脸 所有神经网络的深层缺陷 蠕虫在尾巴上平衡杆子 Kickstarter上的OpenCV AI套件 TensorFlow-Google的开源AI和计算引擎 众包取代新闻工作者 Google的DeepMind学会玩街机游戏 哑机器人V智能机器人 .NET与.NET 5融为一体 Google的深度学习-语音识别 LInQer将.NET LINQ移植到Javascript 机器人TED演讲-新的图灵测试? GAN的发明者加入苹果 您的智能手机会监视您键入的内容 人工智能帮助改善国际象棋 Zalando Flair NLP库已更新 TensorFlow 1.5包含移动版本 AlphaGo输了一场比赛-比分3-1 虚拟机器学习峰会 Microsoft开源AI调试工具 SharePoint走向移动 F#4.0发出文化变革的信号 克里斯蒂拍卖AI艺术品 人工智能如何区分 Facebook在蒙特利尔的新AI实验室 Mozilla想要您的声音 微软使用极深的神经网络赢得ImageNet 建立AI合作伙伴关系 .NET Core 3-Microsoft几乎回到了起点 神经网络-更好的销售商? Google使用AI查找您的住所 虹膜-适用于Android的Siri证明苹果没有优势 TensorFlow 2提供更快的模型训练 深度学习研究人员将为Google工作
您的位置:首页 >数据库 >

Google使用AI查找您的住所

Google的最新研究论文概述了它如何使用AI读取自然图像(特别是街景照片)中的数字。

Google有一个庞大的数据库,其中包含城市(某些城市并非如此)环境的照片。除了其好奇心之外,图像中还锁定了许多数据,显然让AI代理查看整个语料库并获取有用的信息是一个好主意。

在具有无监督功能的自然图像中读取数字中,学习Google /斯坦福小组介绍了他们如何着手从街景视图图像中提取门牌号。

虽然已经适当地很好地解决了特定的OCR问题,但读取普通图像中的偶数数字仍然很困难且尚未解决。如果可以做到,那么这将使Google可以创建更加准确的地图,从而提供导航服务。还建议,通过了解照片中的门牌号,可以改进地理编码以提供目标目的地的准确视图-即,不仅是您要去往的一般视图,而且还可以看到您所看到的房子的视图正在尝试前往。

现有技术往往基于手工构建的特征,这些特征已微调到可以找到文本的上下文。在更一般的设置中,这些方法不太可能也行得通。所采用的方法是首先定位图像中门牌可能位于的位置。接下来,对检测到的区域进行数字识别算法。

为了测试他们的方法,他们首先创建了一个数据子集,该数据子集由600,000张带有标记数字的图像组成,这些图像是借助Amazon Mechanical Turk构建的。

googlehousenumbers

他们首先尝试了OCR工作中通常使用的手工功能,然后发现这种方法效果不佳。接下来,他们尝试了特征学习算法-堆叠式稀疏自动编码器和基于K均值的系统。手工制作的特征实现了63%和85%的准确性,而两个学习特征分类器的准确性约为90%-应该与98%的人工精度进行比较。

事实证明,大型训练集对于实现良好的性能非常重要,这再次强化了这样的观念,即由于无法使用大型训练集,过去使用的许多AI技术都可能表现不佳。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。