ORC在Hive中如何应用

技术ORC在Hive中如何应用这篇文章主要介绍了ORC在Hive中如何应用,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。ORC文件不仅仅是一种列式文件存储

本文主要介绍ORC在Hive中的应用,具有一定的参考价值。有兴趣的朋友可以参考一下。希望大家看完这篇文章后有很多收获。让边肖带你去了解一下。

ORC文件不仅是列式文件存储格式,也是很高的压缩比文件,是MapReduce的可切分(Split)文件。因此,在Hive中使用ORC作为表的文件存储格式,不仅可以在很大程度上节省HDFS存储资源,还可以大大提高数据的查询和处理性能,因为ORC比其他文件格式具有更高的压缩比,而且查询Task的输入数据减少,使用的任务也减少。

性能改进的另一个方面是为ORC文件中的每个字段建立一个轻量级的索引,以确定文件中是否满足WHERE子句中的筛选条件。例如,在执行HQL语句“SELECT COUNT(1) FROM xxx WHERE a=1”时,首先从ORC文件的元数据中读取索引信息,快速定位id=0所在的偏移量,如果在索引信息中没有找到id=0的信息,则直接跳过该文件。

在hive中执行以下语句,创建一个新的Hive表xxx,并将存储格式指定为ORC。

CREATETABLExxx(名称字符串,颜色字符串)STOREDASORC

如果一个表不是以ORC格式存储的,并且您想现在将其更改为ORC格式,您可以执行以下语句:

alteretablexxxsetfileformatorc;

从hive 0.14版本开始,可以执行以下语句来合并ORC小文件。合并发生在条带级别,因此没有重新解压缩编码。

alter table XXX[partition partition _ spec]CONCATENATE;

如果想查看ORC文件的信息,可以执行以下语句,其中path为hdfs路径。

hive-orckfile dumppath _ to _ file

从Hive 1.1开始,如果想查看ORC的数据内容,可以执行以下语句:

hive-orckfile dump-dpath _ to _ file

感谢您仔细阅读本文。希望边肖分享的文章《如何在蜂巢应用ORC》对大家有所帮助。同时希望大家多多支持,关注行业信息渠道,多了解!

内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/143185.html

(0)

相关推荐

  • 鲜为人知的读音,\”鲜为人知\”的意思是什么

    技术鲜为人知的读音,\鲜为人知\的意思是什么鲜为人知的意思是很少有人知道。 鲜为人知,读作鲜为人知的读音:xiǎn wéi rén zhī 相关词汇: 1、近义词:无人问津 不为人知 默默无闻 平淡无味
    2、反义词:路

    生活 2021年10月19日
  • 怎么构建nftables

    技术怎么构建nftables这篇文章将为大家详细讲解有关怎么构建nftables,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。当前,有一个与 nftables 兼容的 iptables

    攻略 2021年10月26日
  • 如何浅析数据库与缓存的双写一致性问题

    技术如何浅析数据库与缓存的双写一致性问题今天就跟大家聊聊有关如何浅析数据库与缓存的双写一致性问题,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。缓存由于其高并发和高

    攻略 2021年12月1日
  • @GetMapping @PathVariable传double类型数据时丢失精度怎么办

    技术@GetMapping @PathVariable传double类型数据时丢失精度怎么办本篇文章为大家展示了@GetMapping @PathVariable传double类型数据时丢失精度怎么办,内容简明扼要并且容

    攻略 2021年10月20日
  • spring集成mybatis依赖配置

    技术spring集成mybatis依赖配置 spring集成mybatis依赖配置dependencies
    !-- 测试依赖--dependencygroupIdjunit/groupIdarti

    礼包 2021年10月27日
  • linux部署dotnetcore应用(linux部署多个dotnetcore网站)

    技术在Linux下怎么为dotnet创建守护进程本篇内容介绍了“在Linux下怎么为dotnet创建守护进程”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧

    攻略 2021年12月23日