首页
技术小册
AIGC
面试刷题
技术文章
MAGENTO
云计算
视频课程
源码下载
PDF书籍
「涨薪秘籍」
登录
注册
操作PDF介绍
打开与保存PDF文档
读取文档与文档尺寸
读取页面和保存页面
合并文档
修改PDF
旋转页面
缩放页面
裁剪页面
提取文本
提取图片
添加水印
查看元数据
更新元数据
加密文档
解密文档
Word转PDF
Excel转PDF
PPT转PDF
PDF转Word
当前位置:
首页>>
技术小册>>
Python与办公-玩转PDF
小册名称:Python与办公-玩转PDF
一个文件往往会有一些用来描述自身属性的数据信息,比如说作者、创建时间、标题、版权声明等,我们把这些数据称为元数据。我们可以访问PdfReader对象的metadata属性或者调用它的getDocumentInfo()方法获取支持读写的元数据,代码如下: ```bash # 查看元数据 from PyPDF2 import PdfReader reader = PdfReader("./pdf_ files/练习文档.pdf") meta = reader.metadata # meta = reader.getDocumentInfo() print(type(meta),len(meta),meta.keys()) # 作者 print(meta.author) # 创建者 print(meta.creator) # 制作者 print(meta.producer) # 标题 print(meta.title) # 子标题 print(meta.subject) # 获取其他键值 print(meta.getText("/Company")) ``` 这些元数据存储在一个DocumentInformation对象里,这个对象是继承于字典的,所以你可以把它当字典使用,比如说可以调用它的keys()方法查看所有元数据的键名。
上一篇:
添加水印
下一篇:
更新元数据
该分类下的相关小册推荐:
Python机器学习基础教程(下)
Python合辑4-130个字符串操作示例
Python神经网络入门与实践
Python数据分析与挖掘实战(上)
Python合辑12-面向对象
Python编程轻松进阶(三)
实战Python网络爬虫
Python合辑11-闭包函数
Python与办公-玩转Excel
Python编程轻松进阶(一)
Python合辑10-函数
Python合辑6-字典专题