作者:
出版社:
本书是Hive的实战教材,介绍利用Hive的SQL方法HiveQL来汇总、查询和分析存储在Hadoop分布式文件系统上的大数据集合。具体内容包括在CDH环境下安装配置Hive及操作案例、Hive基本架构、数据类型、数据库和表操作、Hive数据分区、Hive数据操作等及示例,还包括如何高效执行DML,表、用户定义函数等的具体用法,以及对Hive的优化、在Hadoop生态系统进行工作等。