读取文档,前提是该文档存在,然后再实例化一个PdfReader对象,实例化的时候要传入文档所在路径,可以是绝对路径或者相对路径。这里读取的是上一步保存的PDF文档,记得里面添加了两个空页面吧,我们可以访问PdfReader对象的pages属性获取所有页面,使用len()函数看一下pages是否有两个页面,答案是肯定的。代码如下:
from PyPDF2 import PdfReader
reader = PdfReader("./pdf_ files/test.pdf")
print(len(reader.pages)) # 输出:2
刚刚在调用add_blank_page()方法新增空白页的时候,传入的宽高参数分别是595.28和841.89,这个是A4纸的尺寸,这两个值是怎么得到的呢?首先要知道pypdf2的长度单位叫作“用户默认空间单位(default user space units)”,可能每个字你都懂,但连起来就不懂了。其实用户默认空间单位就是我们常说的磅,而1磅约等于0.3528 毫米,主要换算关系如下:
1磅=1/72英寸
1英寸=25.4毫米
1磅=1/72*25.4=0.35277777777…(无限不循环)毫米
A4的大小是210毫米×297毫米,按照磅与毫米的关系就可以轻松得到A4尺寸的磅数是595.28磅×841.89磅,当然这只是一个大概的值。