游客,欢迎访问首都图书馆!
帮助中心
您的建议
False
本馆资源
本馆资源
高级检索
全部
题名
ISBN
作者
出版社
电子图书
首页
本馆资源
首图冬奥主题书目
数字资源平台
>
工学
>
软件工程
>
网络爬虫全解析
网络爬虫全解析
作者:
罗刚
著
出版社:
电子工业出版社
出版时间:
2017.03
ISBN:
978-7-121-31071-3
主题:
软件工具
中图法分类号:
TP311.561
【中图法分类】
T 工业技术
>
TP自动化技术、计算机技术
>
TP3计算技术、计算机技术
>
TP31计算机软件
【学科分类】
工学
>
软件工程
建议阅读终端:
随书光盘:
扫描用手机阅读此书支持Android/iPhone
在线试读
PDF格式
编辑推荐
简介
目录
评论
暂无推荐
简介
本书介绍了如何开发网络爬虫。内容主要包括开发网络爬虫所需要的Java语法基础和网络爬虫的工作原理,如何使用开源组件HttpClient和爬虫框架Crawler4j抓取网页信息,以及针对抓取到的文本进行有效信息的提取。为了扩展抓取能力,本书介绍了实现分布式网络爬虫的关键技术。另外,本书介绍了从图像和语音等多媒体格式文件中提取文本信息,以及如何使用大数据技术存储抓取到的信息。最后,以实战为例,介绍了如何抓取微信和微博,以及在电商、医药、金融等领域的案例应用。其中,电商领域的应用介绍了使用网络爬虫抓取商品信息入库到网上商店的数据库表。
目录
展开 ∨
评论(0)
评分:
1
2
3
4
5
评价:
请输入评论信息
5
0
/255
我要评论
最新上架