python入门教程(非常详细)pdf,Python笔记

  python入门教程(非常详细)pdf,Python笔记

  本文主要介绍python使用技巧的细节Pdf。PyPDF2是一个纯Python的开源库,可以拆分或合并PDF文件,也可以剪切或转换PDF文件中的页面。下面会详细介绍文章的主题内容,有需要的可以参考一下。

  00-1010 1.读取pdf2。删除PDF 3的部分页面。旋转第4页。合并PDF前言:

  PY2是一个纯Python开源库,可以拆分或合并PDF文件,也可以剪切或转换PDF文件中的页面。我们还可以使用PyPDF2查看PDF文件的元信息,加密PDF文件等。

  PDF 2是开源库,需要安装后才能使用。

  pip安装PyPDF2

  

目录

  导入PyPDF2

  reader=PyPDF2。PdfFileReader(打开( a.pdf , rb ))

  print(reader.getNumPages())

  print(reader.getIsEncrypted())

  print(reader.getDocumentInfo())

  page=reader.getPage(8)

  print(page.extractText())

  首先,导入PyPDF2模块,然后以二进制读取模式打开a.pdf文件,并将其传递给PdfFileReader类的初始化函数。PdfFileReader的初始化函数会返回一个PdfFileReader类的对象,我们可以用它来获取PDF文件的信息。

  通过getNumPages函数获取pdf的总页数,通过getIsEncrypted函数获取文件是否加密,通过getDocumentInfo函数获取文件的元数据,通过向getPage函数传递下标获取PDF页面。下标从0开始,这与Python内置的字符串、列表和元组一致。使用PageObject类的extractText方法提取页面中的文本。从这种方法的返回结果来看,提取PDF文本的效果并不理想。

  

1.读取PDF

  思路:PyPDF2不能直接编辑PDF文件,但是我们可以使用py PDF 2将所需页面从一个PDF文档复制到另一个PDF文档中,通过这种迂回的方式实现编辑PDF的功能。例如,删除a.pdf的第一页。

  导入PyPDF2

  reader=PyPDF2。PdfFileReader(打开( a.pdf , rb ))

  输出=PyPDF2。PdfFileWriter()

  对于范围(1,reader.getNumPages()):中的I

  output . add page(reader . get page(I))

  outputStream=open (b.pdf , wb )

  output.write(输出流)

  outputStream.close()

  

2.删除pdf的某些页

  page类中有一些方法可以修改PDF页面,其中rotateClockwise和rotateCounterClockwise方法用于旋转页面。这两种方法只接受一个参数,参数的值必须是90的倍数,表示旋转多少度。

  导入PyPDF2

  reader=PyPDF2。PdfFileReader(打开( a.pdf , rb ))

  输出=PyPDF2。PdfFileWriter()

  page=reader.getPage(0)

  page.rotateClockwise(180)

  output.addPage(页面)

  outputStream=open (b.pdf , wb )

  output.write(输出流)

  outputStream.close()

  

3.旋转页面

  从PyPDF2导入PDF文件合并器

  merger=PdfFileMerger()

  a=打开( a.pdf , rb )

  b=打开( b.pdf , rb )

  c=打开( c.pdf , rb )

  merger.append(fileobj=a,pages=(0,3))

  merger.merge(position=2,fileobj=b,pages=(0,1))

  merge . append(c)

  输出=打开( d.pdf , wb )

  merger.write(输出)

  append方法通过fileobj参数确定要添加的PDF文件,通过pages参数指定要添加到新PDF文件中的PDF页面,并将要添加的页面添加到merger对象的末尾。与append方法相比,merge方法增加了position参数,通过这个参数我们可以指定页面插入的位置。append方法和merge方法的Pages参数非常灵活。它是一个三元组(start,stop[,step]),分别代表起点、终点和步长。我们可以通过这个参数指定合并后的PDF文件中的页面。

  这篇关于python使用技巧的详细介绍Pdf就到此为止。关于python使用技巧Pdf的更多信息,请搜索热门IT软件开发工作室之前的文章或者继续浏览下面的相关文章。希望大家以后多多支持热门IT软件开发工作室!

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: