python实现pdf文件转为图片(中文也可以转换)

需要用到模块wand,这是Imagemagick的Python接口。我们需要用它来将pdf转换为图片
安装方法

pip install wand

实现的方法在下面代码中,仔细看里面注释

 
#coding:utf-8
from wand.image import Image
 
# 将pdf文件转为jpg图片文件
# ./PDF_FILE_NAME 为pdf文件路径和名称
image_pdf = Image(filename='./PDF_FILE_NAME',resolution=300)
image_jpeg = image_pdf.convert('jpg')
 
# wand已经将PDF中所有的独立页面都转成了独立的二进制图像对象。我们可以遍历这个大对象,并把它们加入到req_image序列中去。
req_image = []
for img in image_jpeg.sequence:
    img_page = Image(image=img)
    req_image.append(img_page.make_blob('jpg'))
 
# 遍历req_image,保存为图片文件
i = 0
for img in req_image:
    ff = open(str(i)+'.jpg','wb')
    ff.write(img)
    ff.close()
    i += 1

参考资料:
http://www.cnblogs.com/webRobot/p/5883841.html

Leave a Reply

Your email address will not be published. Required fields are marked *