承接业务:仿站,建站,网站seo优化顾问……,请联系qq: 1470504292

 分类:python

python打包生成exe程序软件

python打包生成exe程序软件
如果我们需要将写好的python程序分享给他人使用,而对方电脑上没有python环境,并且对方还是个小白。这种情况下,我们丢几个py文件过去,对方肯定懵逼。 在Windows系统下,我们可以将python程序生成exe文件,这样对方不用安装python环境,直接打开exe文件就可...

2017-11-16 430浏览 2评论 1喜欢

scrapy通过脚本运行的简单方法

scrapy通过脚本运行的简单方法
我们在写好scrapy爬虫之后,每次运行都要在控制器里写这一段 scrapy crawl spiders1(爬虫名字) 很烦人!! 还有我们当我们需要通过运行脚本的方式开启scrapy爬虫,网上给出大多是很复杂的方法,复杂就复杂吧,还不好用。 均益这里给出的这种运行scr...

2017-06-06 886浏览 0评论 3喜欢

BloomFilter布隆过滤器python的实现方法

BloomFilter布隆过滤器python的实现方法
BloomFilter布隆过滤器是什么? 不知道BloomFilter的朋友,请参考这篇文章海量数据处理算法—Bloom Filter BloomFilter布隆过滤器python的实现方法 安装pybloomfiltermmap模块 pip install pybloomfi...

2017-06-01 1830浏览 0评论 5喜欢

BloomFilter与redis联合去重的python的代码

BloomFilter与redis联合去重的python的代码
我们在爬大型网站的时候,需要处理上千万乃至上亿的url的去重。如果采用python的自带set,或者redis的set,那就需要占用很大的内存。如果存入将url存入数据库去重,那速度又会变慢。这种量级以上的去重,一般是采用BloomFilter,但是如果机器down机了,那Blo...

2017-05-31 2155浏览 0评论 2喜欢

python 常用日期和时间格式化操作

python 常用日期和时间格式化操作
均益总结整理一下python获取当前时间的方法,包括获取时间戳和格式化的时间,大家如果还需要其他python操作时间的方法,可以在评论里留言,均益继续更新上去。 python 获取当前的时间戳(1970年后经过的浮点秒数) import time print time.ti...

2017-04-13 839浏览 0评论 1喜欢

python selenium启动不了火狐浏览器(firefox)的解决办法

python selenium启动不了火狐浏览器(firefox)的解决办法
selenium3.0之前的版本,是可以直接打开火狐浏览器的,但3.0之后的版本的就不支持了。需要我们单独装上驱动。 pip show selenium 查看一下你的selenium版本,如果是3.0以上的,说明需要安装驱动了。那么问题来了,怎么安装驱动呢? 1、首先下载最新版的...

2017-03-02 5556浏览 0评论 18喜欢

python xpath 解析网页常用方法总结

python xpath 解析网页常用方法总结
python xpath解析网页用到的是lxml库,lxml的使用方法可以官方文档 http://lxml.de/lxmlhtml.html xpath 的定位查找,可以查看 http://www.runoob.com/xpath/xpath-tutorial.html 上面的两...

2016-12-15 1408浏览 4评论 7喜欢