python pdfkit 中文乱码问题的解决方案-巨人网络通讯

企业400电话

微网小程序

AI电话机器人

电商代运营

全部栏目

企业400电话网络优化推广 AI电话机器人呼叫中心网站建设商标✡知产微网小程序电商运营彩铃•短信增值拓展业务

python pdfkit 中文乱码问题的解决方案

使用python pdfkit生成pdf文件中遇到中文乱码问题

1.生成的文件名不能带有中文字符

2.生成的pdf内容中文为乱码

生成的文件名不能带有中文字符

解决方法：

我暂时想到的处理方式是先生成英文文件名，再将这个文件重命名为中文的文件名

#coding=utf8
import os
import pdfkit
from uuid import uuid1
ret = 'html>head>meta charset="UTF-8">/head>body>h1>测试pdf内容部分/h1>/body>/html>'.decode('utf8')
file_name = str(uuid1())
pdfkit.from_string(ret, file_name) # file_name不能带有中文 如果有会报错
file_name_new = '测试.pdf'
os.rename(file_name, file_name_new)

生成的pdf内容中文为乱码

原因1：

因为pdfkit生成pdf功能其实调用的是webkit的子模块wkhtmltopdf(通过命令行方式)，所以pdfkit生成中文乱码其实是wkhtmltopdf中文乱码导致的；而wkhtmltopdf中文乱码是因为系统中不存在中文字体导致的

解决方法：

在系统中添加中文字体

我的本地电脑是ubuntu14.04的字体文件保存在/usr/share/fonts下(包含了中文字体文件具体哪一个我也不知道汗。)，我的服务器是redhat系统(没有中文字体)，所以在我的电脑上操作如下:

cd /usr/share/fonts
zip -r fonts.zip ./*
scp fonts.zip 服务器用户名@服务器ip:/usr/share/fonts

在服务器上操作如下:

cd /usr/share/fonts
unzip fonts.zip
fc-cache -fv
fc-list # 查看新添加的字体

你需要找一台有安装了中文字体的电脑复制一份字体文件(就是/usr/share/fonts下的文件)，然后如我以上操作就可以了。

原因2：

需要在html的字符集设置为utf8

head>meta charset="UTF-8">/head>

补充：python写入html文件中文乱码-解决办法

使用open函数将爬虫爬取的html写入文件，有时候在控制台不会乱码，但是写入文件的html中的中文是乱码的

案例分析

看下面一段代码：

# 爬虫未使用cookie
from urllib import request
if __name__ == '__main__':
 url = "http://www.renren.com/967487029/profile"
 rsp = request.urlopen(url)
 html = rsp.read().decode()
 with open("rsp.html","w")as f:
 # 将爬取的页面
 print(html)
 f.write(html)

看似没有问题，并且在控制台输出的html也不会出现中文乱码，但是创建的html文件中

解决方案

使用open方法的一个参数，名为encoding=” “，加入encoding=”utf-8”即可

# 爬虫未使用cookie
from urllib import request
if __name__ == '__main__':
 url = "http://www.renren.com/967487029/profile"
 rsp = request.urlopen(url)
 html = rsp.read().decode()
 with open("rsp.html","w",encoding="utf-8")as f:
 # 将爬取的页面
 print(html)
 f.write(html)

运行结果

以上为个人经验，希望能给大家一个参考，也希望大家多多支持脚本之家。如有错误或未考虑完全的地方，望不吝赐教。

您可能感兴趣的文章:

python解析PDF程序代码
python实现csdn全部博文下载并转PDF
Python合并多张图片成PDF
Python提取PDF指定内容并生成新文件
详解用Python把PDF转为Word方法总结
python操作mysql、excel、pdf的示例
python 三种方法提取pdf中的图片
Python实现给PDF添加水印的方法
Python读取pdf表格写入excel的方法
Python 多张图片合并成一个pdf的参考示例

上一篇：python 实现存储数据到txt和pdf文档及乱码问题的解决
下一篇：Python中删除文件的几种方法实例

相关文章

python pdfkit 中文乱码问题的解决方案

使用python pdfkit生成pdf文件中遇到中文乱码问题 1.生成的文件名不能带有中文字符 2.生成的pdf内容中文为乱码生成的文件名不能带有中文字符解决方法：我暂时想到的处理方式是先生成python,pdfkit,中文,乱码,问,...

运城联通外呼机器人批发网,电销机器人-诚信服务

运城联通外呼机器人批发网,电销机器人系统通常都支持通话记录的批量和重复播放，人...

公司400电话怎么申请开通（移动400电话怎么申请）

公司400电话怎么申请开通（移动400电话怎么申请）现在越来越多的企业开始注重客户服...

电话机器人加盟的注意事项

电话机器人加盟的注意事项人工智能的发展已经成为这个时代的主旋律，相信在各大信...

外呼系统图片及价格（外呼系统报价）

本文目次一览： 1、市道上外呼零碎挺多的，外呼零碎几何钱一个？ 2、外呼零碎一个几...

oem电话机器人贴牌（电话机器人品牌排行）

本文目录一览：1、市面上这么多电话机器人品牌,哪家效果比较好2、OEM就是贴牌生产讲...

个人站长成功创业三要素

9月23日有幸参加了全国的互联网大会，这次大会大家从网上也看了很冷清，开幕式感觉...

淮安白名单电销卡真的不封号吗

淮安白名单电销卡真的不封号吗电销企业最离不开的就是电销卡，因为电销卡可以满足...

南昌今年将采取“点对点”招商方式开拓服务外包市场

为加快我市服务外包产业的发展，我市今年将推进与国内外服务外包发达城市的交流与...

外呼系统后台修理时间的简单介绍

本文目次一览： 1、外呼零碎怎样操持？ 2、外呼零碎是怎样用的？ 3、网御零碎中事中...

汉沽区电话机器人维修点（汉沽家电修理电器电话）

本文目录一览：1、帅康燃气灶维修电话——24小时全国统一400客服维修服务中心2、玉溪...

长春不封号外呼系统服务商,电话呼叫软件多少钱-欢迎光

长春不封号外呼系统服务商,电话呼叫软件多少钱壁龛式安装稳定牢固。4)从切换箱拉至...

发送侵权通知时应一并提供权利人身份证明、联系方式等

【案例要旨】在权利人或利害关系人依据侵权责任法第三十六条向电商平台发送侵权通...

湖州防封电销系统多少钱

湖州防封电销系统多少钱打电话前，可以先用软件对号码进行筛选，减少无效的拨打，...

上市公司审批更需要简政放权

2015年03月06日讯作为来自上市公司的代表，我更关注在审批制度改革中政府如何给企业...

福州防封电销系统加盟（防封号电销系统安全吗）

本篇文章给大家谈谈福州防封电销系统加盟，以及防封号电销系统安全吗对应的知识点...

python pdfkit 中文乱码问题的解决方案

使用python pdfkit生成pdf文件中遇到中文乱码问题 1.生成的文件名不能带有中文字符 2.生成的pdf内容中文为乱码生成的文件名不能带有中文字符解决方法：我暂时想到的处理方式是先生成python,pdfkit,中文,乱码,问,...

© 2016-2020 巨人网络通讯版权所有

《增值电信业务经营许可证》苏ICP备15040257号-8

python pdfkit 中文乱码问题的解决方案 python,pdfkit,中文,乱码,问,