爬虫项目 – 均益个人博客

scrapy分布式爬虫使用bloomfilter去重

Posted on 2017年6月14日2017年6月15日 by 均益

在上一篇博文中，我们介绍scrapy简单的分布式爬虫是通过scrapy-redis这个模块来实现的。各个服务器 […]

Continue Reading

scrapy简单分布式爬虫的实现方法

Posted on 2017年6月12日2018年7月14日 by 均益

原理所有机子连接同一个redis,获取和存放url scrapy和redis通过scrapy-redis连接 […]

Continue Reading