Javatpoint标志
Javatpoint标志

使用Python操作PDF

在上一篇教程中,我们讨论了可以使用Python编程语言的不同包和模块对PDF文件执行的各种操作。我们已经学习了不同的Python库的工作原理,这些库可以用来操作PDF文件。此外,我们还了解了如何使用Python提取文本、图像、表和url。

下面的教程将介绍操作PDF文件的其他一些操作,包括创建PDF文件、在PDF文件上添加文本、图像和表格等。

那么,我们开始吧。

使用Python创建PDF文件

Python提供了一个功能,程序员也可以直接从代码创建PDF文件。我们可以将Python代码中的文本、图像、表格和表单直接插入到PDF文件中。为了实现同样的目的,Python编程语言提供了一个名为reportlab。

但是在我们开始使用库之前,我们有必要安装它。

安装reportlab库

我们可以安装reportlab在PIP安装程序中使用以下命令创建库:

语法:

现在,让我们从实施部分开始;我们可以执行以下操作:

例子:

解释:

在上面的代码片段中,我们从各自的模块中导入了所需的函数。然后我们创建了一个PDF文件newfile.pdf。画布()函数中,我们将PDF页面的大小设置为a类提供的预定义大小reportlab图书馆。然后,我们使用save ()函数。

使用Python在PDF上添加文本

的帮助下,我们可以很容易地添加PDF文件reportlab图书馆。让我们考虑下面的例子来理解这一点:

例子:

输出:

使用Python操作PDF

解释:

在上面的代码片段中,我们再次从各自的模块导入了函数。然后,我们创建了一个名为textfile.py。我们正在设置字体和字体大小,因为我们要在PDF文件上写入一些文本。我们将PDF大小设置为信,字体快递,字体大小为18借助的预定义函数reportlab。然后我们选择了紫色的的帮助下为文本上色setFillColor函数。在此之后,我们在PDF文件上编写了一些文本,指定了文本在PDF页面上的位置。最后,我们使用save ()函数。因此,我们已经成功地创建了一个PDF文件。

使用Python在PDF上添加图像

我们可以利用蟒蛇reportlab库,以便在PDF文件中插入图像。与在PDF文件中插入文本相比,插入图像可能是一项繁琐的工作。图像有其独特的大小,PDF文件也是如此。因此,管理图像的大小和寻找图像的最佳位置可能是一项繁琐的工作。

让我们考虑下面的例子来理解如何在PDF文件上添加图像:

例子:

输出:

使用Python操作PDF

解释:

在上面的代码片段中,我们导入了所需的函数。然后我们用画布()函数创建新的PDF文件。然后我们用drawInlineImage ()函数,以便在创建的PDF文件中插入图像。我们已经指定了图像在目录中的位置以及图像的位置,即:(100, 450)在PDF文件中进行设置。的reportlab库将PDF文件的左下角位置视为(0,0)并以类似的方式管理图像的位置。字体大小PDF的尺寸为612 x792,(100, 450)将是图像在PDF文件中的位置。

使用Python在PDF上添加表

控件将表添加到PDF文件中reportlab图书馆。让我们考虑下面的示例,以了解如何在PDF文件上添加表。

例子:

输出:

使用Python操作PDF

解释:

在上面的代码片段中,我们创建了一个字母大小的新PDF文件。要存储在表中的数据在列表中提供“my_data”。这里,列表的形状是5 x2。有五行两列。因此,这是将在PDF文件上形成的表。之后,我们定义了表格的边距、网格线、它们的大小和形状。我们也用过setStyle函数。也可以参考官方文档reportlab用于创建表的库。如果这些网格线没有被定义,那么PDF上就只有排列有序的细节;然而,没有被网格线或边界分开。

使用Python在PDF上突出显示文本

Python还为我们提供了突出显示PDF文件上的文本内容的功能,称为“菲茨一样”。弗茨是我们可以用来在PDF文件上执行文本高亮显示的最简单的库。的安装过程弗茨的实现弗茨以突出显示PDF文件上的文本。

例子:

输出:

使用Python操作PDF

解释:

在上面的代码片段中,我们导入了弗茨图书馆。然后我们用open ()函数,以便加载PDF文件my_file.pdf,这是要突出显示的。要突出显示的短语在文本变量上给出。我们在高亮这个词“无聊”。然后,我们遍历每个页面,以查找是否有与该单词匹配的潜在内容。如果我们找到一个匹配的词,我们就使用了add_highlight_annot函数弗茨为了突出它们。因此,通过这种方式,我们在PDF文件上获得了高亮显示的文本。

使用Python调整PDF页面的大小

调整页面大小是使用Python操作PDF文件的另一个示例。有时,PDF页面可能需要调整大小,Python提供了一个名为PyPDF2,使用它,程序员可以执行页面调整大小的功能。让我们考虑下面的例子来理解这一点:

例子:

输出:

使用Python操作PDF

解释:

在上面的代码片段中,我们导入了所需的库。然后,我们从读取必须调整大小的输入PDF文件开始。然后,我们读了它的页面。在这里,我们只调整了第一页的大小,所以getPage函数提供的值0,它代表初始页面。现在,为了调整页面的大小,我们使用scaleBy函数并缩放第00.5.因此,第一个页面的实际尺寸减少了一半。然后我们将页面保存到一个新的PDF文件中resizedFile.pdf。通过这种方式,我们已经成功地使用Python执行了页面大小调整。

使用Python将PDF文件转换为CSV

有时,表格数据也以PDF格式出现。但是,不能直接解析这些类型的信息。例如,我们不能直接使用方法处理带有数据帧的PDF文件熊猫库,并且在处理之前必须将它们转换为CSV或Excel格式。由于这是一个相当重要的过程,我们将了解如何将PDF文件转换为CSV格式。

让我们从安装名为tabula的Python库开始

安装表格库

我们可以安装横膈在PIP安装程序中使用以下命令创建库:

语法:

现在,让我们来了解一下实施的横膈使用以下示例将PDF文件转换为CSV格式:

例子:

解释:

在下面的代码片段中,我们导入了横膈图书馆。然后我们使用了一个叫做“convert_into”,指定参数为输入PDF文件的路径、文件必须转换到的路径、Output文件的格式以及我们想要转换的页数。通过这种方式,我们可以轻松有效地将PDF文件转换为CSV格式。

我们还可以使用Python等编程语言对PDF文件执行许多其他函数。也可以参考官方文档。







Youtube 视频加入我们的Youtube频道:现在加入

反馈


帮助别人,请分享

脸谱网 推特 pinterest

学习最新教程


准备


热门的技术


b .技术/马华






Baidu
map