游客,欢迎访问首都图书馆! 帮助中心 您的建议
| 纸书荐购 | 收藏

作者:

出版社:

电子工业出版社
出版时间:2019.05
ISBN:978-7-121-31911-2

本书所采用的分析工具为目前颇受好评的IBM SPSS Modeler及开源软件Weka。IBM SPSS Modeler有很好的用户接口,也有不错的分析功能,但缺乏最前沿的分析模块及很难与现有的信息系统结合,而Weka恰能弥补其缺憾。同时,这两个软件都不需要编程,对初入分析领域的读者而言是一个很好的进入点。本书由三位活跃在数据挖掘教学和项目开发一线的人员完成,内容侧重软件的实际操作。本书力图将复杂的技术以浅显的方式加以介绍,尽量避免涉及过多的数学内容。每章都根据所涉及的知识点的不同,本书选取了实用的案例,并为读者准备了相应的思考和练习题。

作者:

出版社:

电子工业出版社
出版时间:2017.09
ISBN:978-7-121-31958-7

本书共18章,主要讲述使用R语言做数据挖掘的方法。其中,第1、2章为数据分析方法概述,第3章为R语言编程基础,第4章至第8章为统计学习方法,第9章至第15章为数据挖掘方法,第16章为时间序列分析方法,第17章为特征工程,第18章为R文本挖掘。

作者:

出版社:

电子工业出版社
出版时间:2017.07
ISBN:978-7-121-31903-7

本书着重讲解了Spark内核、Spark GraphX、Spark SQL、Spark Streaming和Spark MLlib的核心概念与理论框架,并提供了相应的示例与解析。全书共分8章,其中前4章介绍Spark内核,主要包括Spark简介、集群部署、工作原理、核心概念与操作等;后4章分别介绍Spark内核的核心组件,每章系统地介绍Spark的一个组件,并附以相应的案例分析。