内容简介

随着大数据时代的到来,我们经常需要在海量数据的互联网环境中搜集一些特定的数据并对其进行分析,我们可以使用网络爬虫对这些特定的数据进行爬取,并对一些无关的数据进行过滤,将目标数据筛选出来。对特定的数据进行爬取的爬虫,我们将其称为聚焦网络爬虫。

在大数据时代,聚焦网络爬虫的应用需求越来越大。《精通Python网络爬虫》从系统化的视角,为那些想学习Python网络爬虫或者正在研究Python网络爬虫的朋友们提供了一个全面的参考,让读者可以系统地学习Python网络爬虫的方方面面,在理解并掌握了《精通Python网络爬虫》的实例之后,能够独立编写出自己的Python网络爬虫项目,并且能够胜任Python网络爬虫工程师相关岗位的工作。

下载地址

豆瓣评论

  • slogan
    书评全是水军也是厉害05-04
  • wanderby
    作者水平低到常人難以企及的地步。01-13
  • 不落一叶
    前面的原理部分还有一点点意思,而后面讲解工具就太简单了。整体来说,入门级教程吧。代码量太多。精通说不上吧。类似的书太多了。哎07-26
  • DreamFarAway
    对于初学者,还是值得一看的。网络爬虫基础的抓取示例都提供了,包括博客类、图片信息、BBS百科贴文、模拟用户登录等,但是没有浏览器selenium模拟插件及BeautifulSoup网页结构的解析,大部分例子围绕网页查看去定制正则表达式设计;缺少真正的编程算法和原理技巧的解读。给人的感觉,只能做基础的依葫芦画瓢。特别当前网站安全加强的场景下,HTTPS的安全访问要求,很多网页都需要模拟验证获取信息,且内容在JS包定义,不易仿照示例抓取。而爬虫框架主要写Scrapy,内容有点啰嗦,后面章节有点凑数。不管如何,给初学者还是有所启示的。01-07
  • Star
    不是很好,也不算差。还行10-29

猜你喜欢

大家都喜欢