作者:
出版社:
本书以任务驱动为主线,围绕企业级应用进行项目任务设计,主要内容包括数据采集和预处理平台搭建、网络爬虫实践、日志数据采集实践和数据预处理实践等完整的数据采集与预处理应用案例,全面详实地讲述了Scrapy、Flume、Pig、Kettle、Pandas、OpenRefine等技术和urllib、Selenium基本库和BeautifulSoup解析库等的相关知识以及应用案例。