python pdf转word并保持原有的格式,用python将pdf转化为word后,word文件为空
本文主要介绍如何在windows、mac和linux下生成PDF的解决方案。本文中的示例代码解释的很详细,有需要的可以参考一下。
目录
pdf Toolkit-pdfkithtml转pdf URL转pdf字符串生成pdf结合pydocx将word转换成html再转换成pdf。在本章中,我们将学习如何将word文件转换成PDF文件。其实网上有很多生成PDF文件的教程,但是大部分都是以windows为主,兼容性问题很多。windows、mac和linux同时兼容的情况并不多见,所以在今天的章节中,我们将学习如何在windows、mac和linux中生成PDF解决方案。
pdf 工具包 - pdfkit
Pdf包安装:
pip安装pdf包
依赖工具:
下载与你当前系统匹配的安装包后,就可以达到兼容的效果了。
html 转 pdf
将html转换为pdf的方法:
Pdf。kit _ from _ file (html文件,保存路径)使用pdfkit.from_file()函数传入“html”文件和pdf的保存路径。
代码示例如下:
#编码:utf-8
导入工具包#需要安装pdfkit的第三方软件包“pip install pdfkit”和第三方依赖项“wkhtmltopdf”
kit . from _ file( html test file . html , htmltest file.pdf )
运行结果如下:
网址 转 pdf
将URL转换为pdf的方法:
Pdfkit.from_url (url,保存路径)使用Pdfkit.from_url()函数传入pdf的“URL”文件和保存路径。
“html”文件和URL的区别在于,实际上html文件可能是我们在本地开发生成的,也可能是通过“网页另存为”保存在本地的。所以URL和html文件还是有点区别的,但是他们的本质其实是一样的。
代码示例如下:
#编码:utf-8
导入工具包#需要安装pdfkit的第三方软件包“pip install pdfkit”和第三方依赖项“wkhtmltopdf”
pdf kit . from _ URL( https://www . 163.com , test1.pdf )
运行结果如下:
字符串生成pdf
将URL转换为pdf的方法:
Pdf。kit _ from _ string(基于html的字符串,保存路径)使用pdfkit.from_string()函数传入pdf的“URL”文件和保存路径。
基于Html的字符串实际上是前端的一种超文本文件格式,这种前端规范生成的字符串实际上是html字符串。
#编码:utf-8
导入工具包#需要安装pdfkit的第三方软件包“pip install pdfkit”和第三方依赖项“wkhtmltopdf”
html=
超文本标记语言
头
meta charset=utf-8 /
/头
身体
你好,这是一个将html字符串转换成pdf /p的测试文件
/body
/html
pdfkit.from_string(html, html_string_test.pdf )
运行结果如下:
结合 pydocx 将 word 转 html 再转 pdf
您需要安装pydocx依赖包-pip首先安装pydocx。
导入PyDocX函数—从pydocx导入PyDocX
使用PyDocX将word文件转换为html格式(将生成一个html字符串对象)
将生成的html字符串写入html文件。
然后,使用pdfkit包的pdfkit.from_file()函数将其转换为pdf文件。
代码示例如下:
#编码:utf-8
导入pdf包# pip安装pdf包
从pydocx导入PyDocX # pip安装PyDocX
Html=PyDocX.to_html (CV 1.docx )
F=打开( CV 1.html , w )
f .编写(html)
f.close()
#pdfkit.from_file(html1.html , test3.pdf )
Kit.from _ string (HTML,简历1.pdf )
运行结果如下:
关于Python实现Word到PDF的office自动转换的这篇文章到此为止。关于Python从Word转换为PDF的更多信息,请搜索热门IT软件开发工作室之前的文章或者继续浏览下面的相关文章。希望大家以后多多支持热门IT软件开发工作室!
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。