需要用到模块wand,这是Imagemagick的Python接口。我们需要用它来将pdf转换为图片
安装方法
pip install wand
实现的方法在下面代码中,仔细看里面注释
#coding:utf-8 from wand.image import Image # 将pdf文件转为jpg图片文件 # ./PDF_FILE_NAME 为pdf文件路径和名称 image_pdf = Image(filename='./PDF_FILE_NAME',resolution=300) image_jpeg = image_pdf.convert('jpg') # wand已经将PDF中所有的独立页面都转成了独立的二进制图像对象。我们可以遍历这个大对象,并把它们加入到req_image序列中去。 req_image = [] for img in image_jpeg.sequence: img_page = Image(image=img) req_image.append(img_page.make_blob('jpg')) # 遍历req_image,保存为图片文件 i = 0 for img in req_image: ff = open(str(i)+'.jpg','wb') ff.write(img) ff.close() i += 1
参考资料:
http://www.cnblogs.com/webRobot/p/5883841.html