python将pdf文件转换成word文档,python将网页保存为pdf
Kit是一个把HTML CSS格式的文件转换成PDF的工具,是wkhtmltopdf的python包。在本文中,我们将使用pdfkit来实现网页内容到PDF文档和图片的转换。有兴趣的可以了解一下。
00-1010 1、简介2、代码练习2.1模块简介2.2安装2.3代码示例2.4扩展3、总结
目录
鱼:屌丝,你在干嘛?
屌丝:我女神要这个网页的内容。
鱼:那你就不能复制粘贴这一点点。
屌丝:为了我的女神,我会努力…
鱼:我们能成为人吗?顺着网页内容往下爬就行了。
屌丝:我女神也会把这些内容转换成PDF。
鱼:关于你的女神有太多的事情了…
屌丝:鱼哥,你有什么好主意吗?
鱼:嗯,有一个办法。
屌丝:我知道。
小雨:你愿意为你的女神做任何事,所以我会毫不犹豫的直接上教程。
1、引言
关于将网页内容转换成PDF,通常的想法是:
可以实现抓取网页内容保存到本地转换成PDF文档的方法,但是很麻烦,需要两次传输。
今天小宇分享的方法只是三行代码,一次就可以搞定。
2、代码实战
2.1.1 pdfkit
Kit是一个把HTML CSS格式的文件转换成PDF的工具,是wkhtmltopdf的python包。
2.1 模块介绍
pip安装pdf包
其他安装方法请直接参考这两篇文章:
《Python3自动安装第三方库,跟pip说再见》
《Python:一行代码,导入Python所有库》
敲黑板:
Kit是基于WKMLTOPDF的一个包,所以需要先安装WKMLTOPDF。
Wkhtmltopdf官网
2.2 安装
2.3.1 URL 对应网页转 PDF
代码示例:
# -*-编码:utf-8 -*-
# @时间: 2022-06-12
# @作者:卡尔_DJ
导入pdfkit
URL对应网页到PDF
#wkhtmltopdf.exe是本地安装的路径。
config=pdf kit . configuration(wkhtmltopdf=r d : \ program files \ wkhtmltopdf \ bin \ wkhtmltopdf . exe )
#调用PDFkit.from_url参数来转换pdf
pdf kit . from _ URL(r https://blog . csdn . net/wuyoudeyuer?Type=blog , Carl_ yiran.pdf ,configuration=config)
运行结果:
2.3.2 HTML 文件转 PDF
代码示例:
# -*-编码:utf-8 -*-
# @时间: 2022-06-12
# @作者:卡尔_DJ
导入pdfkit
HTML文件到PDF
config=pdf kit . configuration(wkhtmltopdf=r d : \ program files \ wkhtmltopdf \ bin \ wkhtmltopdf . exe )
#调用PDFkit.from_file参数转换pdf
pdf . from _ file(r d : \ Carl _ yiran的博客. h
tml, Carl_奕然.pdf, configuration=config)
敲黑板
读取html,需要调用pdfkit.from_file 参数。
2.3.3 字符串转 PDF
代码示例:
# -*- coding:utf-8 -*-# @Time : 2022-06-12
# @Author : carl_DJ
import pdfkit
字符串转 PDF
config = pdfkit.configuration(wkhtmltopdf=r"D:\ProgramFiles\wkhtmltopdf\bin\wkhtmltopdf.exe")
#调用pdfkit.from_file参数,转换PDF
pdfkit.from_string(rIlike wangxinling, Carl_奕然.pdf, configuration=config)
运行结果
2.4 拓展
小屌丝:鱼哥,如果我不想写代码,能不能一键转换成PDF呢?
小鱼:嗯,这个可以实现,但是不能一键,必须一行代码。
小屌丝:也行,能少些一行是一行。
2.4.1 网页转换PDF
开篇小鱼也说过:pdfkit 是基于 wkhtmltopdf 的封装,所以功能肯定也是基于 wkhtmltopdf 的。
于是乎,我们就能先到,直接用wkhtmltopdf 的功能,看看能否实现PDF转换。
代码示例
第一步、找到wkhtmltopdf的安装路径,以小鱼的为例:
D:\ProgramFiles\wkhtmltopdf\bin\wkhtmltopdf.exe
第二步、powershell打开,输入命令
.\wkhtmltopdf.exe https://blog.csdn.net/wuyoudeyuer/category_9471191.html D:\carl.pdf
运行结果
解析
- .\wkhtmltopdf.exe :调用wkhtmltopdf.exe
- https://blog.csdn.net/wuyoudeyuer?type=blog:url地址
- D:\carl.pdf:保存的路径
2.4.2 网页转换图片
代码示例
我们来试一下网页转换成图片,
同样,
第一步、打开powershell,进入到bin文件夹下
第二步、输入命令:.\wkhtmltoimage.exe https://blog.csdn.net/wuyoudeyuer/category_9471191.html D:\carl.png
运行结果
3、总结
今天的分享,就到这里了。
是不是奇奇怪怪的姿势,又增加了呢。
我们总结一下今天的内容:
pdfkit 可以可以实现的转换:
- URL 对应网页转 PDF
- html文件转 PDF
- 字符串转 PDF
wkhtmltopdf.exe可以实现的转换:
- 网页转图片
- 网页转 PDF
到此这篇关于Python3实现网页内容转换成PDF文档和图片的文章就介绍到这了,更多相关Python网页内容转PDF 图片内容请搜索盛行IT软件开发工作室以前的文章或继续浏览下面的相关文章希望大家以后多多支持盛行IT软件开发工作室!
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。