首页
技术小册
AIGC
面试刷题
技术文章
MAGENTO
云计算
视频课程
源码下载
PDF书籍
「涨薪秘籍」
登录
注册
操作PDF介绍
打开与保存PDF文档
读取文档与文档尺寸
读取页面和保存页面
合并文档
修改PDF
旋转页面
缩放页面
裁剪页面
提取文本
提取图片
添加水印
查看元数据
更新元数据
加密文档
解密文档
Word转PDF
Excel转PDF
PPT转PDF
PDF转Word
当前位置:
首页>>
技术小册>>
Python与办公-玩转PDF
小册名称:Python与办公-玩转PDF
### 读取文档 读取文档,前提是该文档存在,然后再实例化一个PdfReader对象,实例化的时候要传入文档所在路径,可以是绝对路径或者相对路径。这里读取的是上一步保存的PDF文档,记得里面添加了两个空页面吧,我们可以访问PdfReader对象的pages属性获取所有页面,使用len()函数看一下pages是否有两个页面,答案是肯定的。代码如下: ```bash from PyPDF2 import PdfReader reader = PdfReader("./pdf_ files/test.pdf") print(len(reader.pages)) # 输出:2 ``` ### 文档尺寸 刚刚在调用add_blank_page()方法新增空白页的时候,传入的宽高参数分别是595.28和841.89,这个是A4纸的尺寸,这两个值是怎么得到的呢?首先要知道pypdf2的长度单位叫作“用户默认空间单位(default user space units)”,可能每个字你都懂,但连起来就不懂了。其实用户默认空间单位就是我们常说的磅,而1磅约等于0.3528 毫米,主要换算关系如下: 1磅=1/72英寸 1英寸=25.4毫米 1磅=1/72*25.4=0.35277777777…(无限不循环)毫米 A4的大小是210毫米×297毫米,按照磅与毫米的关系就可以轻松得到A4尺寸的磅数是595.28磅×841.89磅,当然这只是一个大概的值。
上一篇:
打开与保存PDF文档
下一篇:
读取页面和保存页面
该分类下的相关小册推荐:
实战Python网络爬虫
Python机器学习实战
Python合辑6-字典专题
剑指Python(磨刀不误砍柴工)
Python3网络爬虫开发实战(上)
剑指Python(万变不离其宗)
Python合辑11-闭包函数
Python机器学习基础教程(上)
Python合辑2-字符串常用方法
Python编程轻松进阶(一)
Python合辑1-Python语言基础
机器学习算法原理与实战