本书以Python语言为基础描述了网络爬虫的基础知识,用大量实际案例及代码,向读者介绍了编写网络爬虫所需要的相关知识要点及项目实践的相关技巧。本书共5章,介绍了爬虫的基本结构及工作流程、抓包工具、模拟网络请求、网页解析、去重策略、常见反爬措施,以及大型商业爬虫框架Scrapy的应用,最后介绍了数据分析及可视化的相关基础知识。
本书共分11章,其中第1-2章主要讲解了HTML标签及属性的应用,结合两个实战项目帮助读者更好地理解相关知识点。第3-6章主要讲解CSS的应用,通过引入4个项目实战并讲解开发思路,对各知识点的应用进行深入分析,同时也提供完整的代码实现。第7-11章则讲解程序设计,包括的基础语法、内置对象的应用、对DOM和BOM的操作,以及如何响应用户的鼠标和键盘操作等,均附有大量的实例应用代码,结合5个项目实战案例,帮助读者深入理解程序设计的原理与应用。