您的当前位置:首页>理财 > 正文

python爬虫框架有哪些 python爬虫框架

  • 2023-06-10 08:03:32 来源:城市网

1、由于项目需求收集并使用过一些爬虫相关库,做过一些对比分析。


(相关资料图)

2、以下是我接触过的一些库:Beautiful Soup。

3、名气大,整合了一些常用爬虫需求。

4、缺点:不能加载JS。

5、Scrapy。

6、看起来很强大的爬虫框架,可以满足简单的页面爬取(比如可以明确获知url pattern的情况)。

7、用这个框架可以轻松爬下来如亚马逊商品信息之类的数据。

8、但是对于稍微复杂一点的页面,如weibo的页面信息,这个框架就满足不了需求了。

9、mechanize。

10、优点:可以加载JS。

11、缺点:文档严重缺失。

12、不过通过官方的example以及人肉尝试的方法,还是勉强能用的。

13、selenium。

14、这是一个调用浏览器的driver,通过这个库你可以直接调用浏览器完成某些操作,比如输入验证码。

15、cola。

16、一个分布式爬虫框架。

17、项目整体设计有点糟,模块间耦合度较高,不过值得借鉴。

18、以下是我的一些实践经验:对于简单的需求,比如有固定pattern的信息,怎么搞都是可以的。

19、对于较为复杂的需求,比如爬取动态页面、涉及状态转换、涉及反爬虫机制、涉及高并发,这种情况下是很难找到一个契合需求的库的,很多东西只能自己写。

20、至于题主提到的:还有,采用现有的Python爬虫框架,相比与直接使用内置库,优势在哪?因为Python本身写爬虫已经很简单了。

21、third party library可以做到built-in library做不到或者做起来很困难的事情,仅此而已。

22、还有就是,爬虫简不简单,完全取决于需求,跟Python是没什么关系的。

相信通过python爬虫框架这篇文章能帮到你,在和好朋友分享的时候,也欢迎感兴趣小伙伴们一起来探讨。

本文由用户上传,如有侵权请联系删除!

标签:

推荐阅读

python爬虫框架有哪些 python爬虫框架

1、由于项目需求收集并使用过一些爬虫相关库,做过一些对比分析。2、以

奥克斯空调怎么样?(奥克斯空调怎么样) 世界速看料

来为大家解答以上问题,奥克斯空调怎么样?,奥克斯空调怎么样很多人还

dat文件用什么软件打开苹果手机(dat文件用什么软件打开)

来为大家解答以上问题,dat文件用什么软件打开苹果手机,dat文件用什么

微动态丨5月全国汽车召回118.21万辆

今年可谓是汽车市场波动,给车友们也搜集到了最新的市场回收动态。据市

猜您喜欢

【版权及免责声明】凡注明"转载来源"的作品,均转载自其它媒体,转载目的在于传递更多的信息,并不代表本网赞同其观点和对其真实性负责。亚洲财富网倡导尊重与保护知识产权,如发现本站文章存在内容、版权或其它问题,烦请联系。 联系方式:8 86 239 5@qq.com,我们将及时沟通与处理。

金融