栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

不能复制?python来帮你解决

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

不能复制?python来帮你解决

相信大家都会经常遇到这种情况(无法复制):

这属于是直接“勒索”了,穷苦大学生表示负担不起啊~

以上这种情况都是网页无法复制文本的情况。不过这些对于Python来说都不是问题。今天笔者就带大家用Python去解决。

核心技术:利用pdfkit库将html网页保存为pdf

1、安装pdfkit库
pip install pdfkit

通过命令安装pdfkit,此外还需要安装exe文件(wkhtmltopdf)下载链接:

https://wkhtmltopdf.org/downloads.html

 选择对应的版本下载并安装(记住自己的安装目录)

2、实战操作

这里我们现在百度文库平台的其中一篇文章进行测试(文章设置了禁止复制)

 比如笔者要进行复制的时候,会出现禁止转载(不让复制),下面开始将这个网页保存pdf。

import pdfkit
import time

if __name__ == '__main__':
    url = "https://wenku.baidu.com/view/e1dd3a2f0066f5335a812103?aggId=e1dd3a2f0066f5335a812103"
    config = pdfkit.configuration(wkhtmltopdf=r'D:wkhtmltopdfbinwkhtmltopdf.exe')
    pdfkit.from_url(url, r"D:素材库%s.pdf"
                    % time.strftime('%Y-%m-%d-%H-%M-%S', time.localtime(time.time())), configuration=config)

这样将内容保存为pdf就可以直接进行复制了。 

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/834836.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号