首页
技术小册
AIGC
面试刷题
技术文章
MAGENTO
云计算
视频课程
源码下载
PDF书籍
「涨薪秘籍」
登录
注册
操作PDF介绍
打开与保存PDF文档
读取文档与文档尺寸
读取页面和保存页面
合并文档
修改PDF
旋转页面
缩放页面
裁剪页面
提取文本
提取图片
添加水印
查看元数据
更新元数据
加密文档
解密文档
Word转PDF
Excel转PDF
PPT转PDF
PDF转Word
当前位置:
首页>>
技术小册>>
Python与办公-玩转PDF
小册名称:Python与办公-玩转PDF
引言 pypdf2有打开文件和保存文件的操作。pypdf2的读和写是两个不同的对象,PdfReader对象用于读取PDF文件,即打开一个PDF文档,PdfWriter对象用于写入文件,即保存文档到硬盘。 ### 保存文档 还是先看一下保存文档的代码吧: ```bash from PyPDF2 import PdfWriter writer = PdfWriter() writer.add_blank_page(595.27,841.89) writer.add_blank_page() with open("./pdf_ files/test.pdf","wb") as f: writer.write(f) ``` 保存文档需要一个PdfWriter对象,但是只创建一个PdfWriter对象还不够,因为一个PDF文档至少要有一个页面,所以我们这里调用PdfWriter对象的add_blank_page()方法新增空白页面。 add_blank_page()方法可以传入页面的宽度和高度,宽高都是整型或浮点型,如果不指定这两个参数,则会使用上一页的宽高。但本例中是一个全新的文档,第一次调用add_blank_page()之前还不存在其他页面,所以此处必须要指定宽高,我传入的是A4纸大小的宽高值,我们晚点再讨论这个值怎么来的。 PdfWriter对象的write()方法可以保存文档,参数是一个流文件对象,我们这里直接给它一个文件描述符即可,为了避免忘记关闭文件描述符,所以还是使用上下文管理器的方式吧。 还需要注意的是,文件描述符的模式要选择“wb”,有关读写模式的知识点应该有点忘了吧?不太记得没关系,你要是说完全没印象就不太给面子了哈。读写模式中的“w”是指覆盖写入(字符串),但PDF数据不是纯文本,所以我们要使用二进制写入,即还要使用“b”,既要覆盖又要二进制读写,所以要设置为“wb”模式。
上一篇:
操作PDF介绍
下一篇:
读取文档与文档尺寸
该分类下的相关小册推荐:
Python数据分析与挖掘实战(上)
Python3网络爬虫开发实战(上)
剑指Python(磨刀不误砍柴工)
Python爬虫入门与实战开发(下)
剑指Python(万变不离其宗)
Python3网络爬虫开发实战(下)
Python爬虫入门与实战开发(上)
Python编程轻松进阶(五)
Python合辑7-集合、列表与元组
Python编程轻松进阶(二)
Python合辑6-字典专题
Python编程轻松进阶(三)