菲洛嘉青春动能素135HA FILLMED® NCTF 135HA LED指示灯的常见故障分析 智微智能 Elkhartlake K075终端,零售产业新选择 天空蓝拓客管理系统详细介绍版 muso公链项目 天使计划 是什么?[秘] 独家揭秘最前沿的家装“黑科技”——掌赋 天博体育欧洲杯特辑,东道主法兰西的失意2016 亚马逊的送货侦察员 学习听起来像挡泥板 Google Comics Factory使ML变得容易 笑着说-男性或女性 Amazon Rekognition中更好的人脸检测 关于Spaun的真相-大脑模拟 两个聊天机器人彼此聊天-有趣又怪异 GANPaint:将AI用于艺术 WCF和WF给予社区 从耳朵到脸 所有神经网络的深层缺陷 蠕虫在尾巴上平衡杆子 Kickstarter上的OpenCV AI套件 TensorFlow-Google的开源AI和计算引擎 众包取代新闻工作者 Google的DeepMind学会玩街机游戏 哑机器人V智能机器人 .NET与.NET 5融为一体 Google的深度学习-语音识别 LInQer将.NET LINQ移植到Javascript 机器人TED演讲-新的图灵测试? GAN的发明者加入苹果 您的智能手机会监视您键入的内容 人工智能帮助改善国际象棋 Zalando Flair NLP库已更新 TensorFlow 1.5包含移动版本 AlphaGo输了一场比赛-比分3-1 虚拟机器学习峰会 Microsoft开源AI调试工具 SharePoint走向移动 F#4.0发出文化变革的信号 克里斯蒂拍卖AI艺术品 人工智能如何区分 Facebook在蒙特利尔的新AI实验室 Mozilla想要您的声音 微软使用极深的神经网络赢得ImageNet 建立AI合作伙伴关系 .NET Core 3-Microsoft几乎回到了起点 神经网络-更好的销售商? Google使用AI查找您的住所 虹膜-适用于Android的Siri证明苹果没有优势 TensorFlow 2提供更快的模型训练 深度学习研究人员将为Google工作
您的位置:首页 >数据库 >

Apache Hive增加了对集合操作的支持

Apache Hive的新发行版具有新功能,包括对Set操作和JDBC Storage Handler的支持。

Hive可用于使用SQL读取,写入和管理分布式存储中的大型数据集。该软件包括用于将用户连接到Hive的命令行工具和JDBC驱动程序。提供了用于数据提取/转换/加载(ETL)的工具。它可以用于通过MapReduce,Spark和Tez查询数据。查询检索可以利用Hive LLAP,YARN和Slider。Hive还支持HPL-SQL的程序使用。

蜂巢

最新版本添加了通用JDBC RDBMS存储处理程序,从而可以将标准DB表导入Hive。

此版本还完成了Hive 2.1中有关Set操作的工作。现在,您可以使用“并集”,“相交”和“例外集”操作通过关系代数查找数据。

ACID事务的处理已通过两种方式得到改进。首先,新版本允许谓词下推到ACID Transactions创建的增量文件。在早期版本中,由ACID事务创建的增量文件如果包含任何更新/删除事件,则不允许谓词下推。这样做是为了在多版本事务失败时保留正确性。新方法将更新分为删除事件和新插入事件的组合。这意味着可以对所有增量文件启用谓词下推而不会破坏正确性。

通过消除逐行缝合,ACID矢量化也得到了改善。在早期版本中,矢量化的行批处理是通过在每次将矢量化的批处理沿着操作员管道向上传递之前一次填充一行来创建的。这样做的原因是,在找到给定行的实际版本之前,需要将来自各种增量文件的ACID插入/更新/删除事件合并在一起。增量文件处理的改进意味着这不再是必需的。更新后的版本直接从基础ORC文件中读取行批,并避免任何拼接。

从拆分读取行批后,将通过对数据行进行交叉引用来找到已删除的行,该数据结构将仅跟踪已删除的事件。当以向量化方式读取ACID文件时,这有望导致大幅提高性能。

其他改进包括通过手动重建添加了简单的实例化视图;支持列出类似于“显示表”的视图;和一个UDF以允许查询uniontype值。

蜂巢

        

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。