全书共10章,第1、2章主要介绍hadoop的概述以及如何搭建hadoop的集群;第3-5章介绍分布式文件系统(HDFS)、分布式计算框架(MapReduce)以及分布式协调服务;第6章介绍hadoop2.0新特性,包含YARN和高可用集群的原理。第7-9章主要介绍Hadoop生态圈的相关辅助系统,包含Hive、Flume、Sqoop;第10章是综合案例的开发,目的是让大家能够利用hadoop的相关组件进行项目的开发,同时加深对Hadoop生态圈的技术的理解。
本书内容包括:XML文档管理和分类技术、知识资源描述语言和发布技术、本体建模和知识揄技术、基于知识库的知识发现关键技术和模型框架,同时给出了基于知识库的知识发现的典型应用。