python3 求问chardet.detect返回网页编码及转码问题

比如这个网站 https://www.quanmin.tv/

源码
但用chardet.detect返回，值为Windows-1254，为什么会出现这种情况呢？

并且这种情况怎样才能转码为utf-8，先decode再encode不能实现正确转码

还有一些网页chardet.detect返回值为为ascii甚至是none，为什么会有这种情况呢？要怎样转化为utf-8呢？求大神们赐教！一直纠结这个问题

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
devmiao 2017-12-09 16:25
关注
http://blog.csdn.net/joeblackzqq/article/details/44429881

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

用Python的chardet检测一个用utf-8保存好的文本文档，输出的是ascii，这是为什么呢？ python 开发语言
2020-05-21 14:42

回答 1 已采纳 https://www.cnblogs.com/mydriverc/articles/4136906.html
python2.7 编码解码问题 python
2022-06-10 16:07

回答 1 已采纳 cahrdet有置信度的，换句话说，它也不是百分百自信检查出来的一定正确
Python3怎么定义txt万能编码格式，并且读取出来？ python
2022-07-09 22:52

回答 2 已采纳 chardet不是python的内置库，你需要import chardet 导入
python第三方库：chardet字符编码检测和乱码处理
2022-04-10 10:52

go2coding的博客这是因为网页中的编码形式并不是python所默认的utf8编码，这时候如果能知道网页中具体的编码，在进行相应的转换就能得到正常的字符编码。在探测网页编码，我们可以使用chardet 。具体的用法如下：安装 github的...
python3.8request got an unexpected... Timeout python 有问必答
2021-03-25 21:42

回答 2 已采纳应该是timeout，不是Timeout,所以报无此参数错误。
关于#Python爬虫#的问题 python
2023-01-25 08:46

回答 3 已采纳您遇到的错误是由于 urllib3 库版本不匹配导致的。在这种情况下，您可以尝试升级或降级 urllib3 库的版本来解决问题。另外，在代码中使用 'requests' 和 'lxml' 两个库进行
python3 word="0"的编码如何变为“utf-8” python
2019-09-25 13:53

回答 2 已采纳话说，你为什么要编码后去匹配字符串啊？直接以str类型来匹配有问题吗？ # -*- coding: UTF-8 -*- from docx import Document import re
Python脚本转换文件编码格式
2019-11-10 16:41

七夕猛虎的博客背景：由于平时使用的阅读代码的软件在处理ASCII编码的中文的时候会出现乱码，例如vscode，source insight等。...所以针对这个问题，我用python写了一个自动转换文件编码格式的脚本，可以有效减少转码的工作量...
Python中的解码问题 pycharm python 正则表达式
2021-07-18 15:47

回答 1 已采纳用utf8替换gbk
python爬虫翻页爬取的数据是第一页的重复数据 python 爬虫问答团队
2021-12-18 19:23

回答 1 已采纳爬下一页就好了
python抓取网页，网页源码无法解码 python
2015-11-01 11:55

回答 2 已采纳 python3 +. 需要安装urllib3. 你也可以试试，直接转换成gb2312.下面的代码亲测可用。 ``` http = urllib3.PoolManager() r=
python 使用chardet获取文件编码格式
2020-07-22 16:44

大琦想要去拯救世界的博客使用chardet库进行处理，下面是一个读文件夹下所有csv文件编码格式的demo: import os import chardet def readFileEncoding(path,file): with open(path, 'rb') as f: file_encoding = chardet.detect(f.read())...
python requests.get得到的中文编码错误数据挖掘
2019-02-07 11:21

回答 1 已采纳 # 如果问题得到解决，请点我回答左上角的采纳和向上的箭头，谢谢这是运行效果 ![图片说明](https://img-ask.csdn.net/upload/201902/07/15495
python 中文编码类型 gb2312 gb180_关于Python中的中文编码问题
2021-03-05 14:10

amulee998的博客这篇文章介绍的内容是关于Python中的中文编码问题，有着一定的参考价值，现在分享给大家，有需要的朋友可以参考一下1.python中的中文编码问题1.1 .py文件中的编码Python 默认脚本文件都是 ANSCII 编码的，当文件中...
python安全编码问题_浅谈Python中的编码问题
2020-12-10 20:43

weixin_39638304的博客对于Python的初学者来说，编码问题相当令人头疼。本文就根据我在学习过程中遇到的问题简单谈一下Python中的编码。首先简单介绍一下几种常见的编码。一、几种常见的字符编码ASCII码ASCII码是基于拉丁字码的一套电脑...
一次性全面分析并理解Python2，Python3编码问题
2019-07-15 12:42

大鹏码字的博客最近在编写阿里云MaxCompute的过程中遇到了字符编码的问题，由于之前一直使用的Python3，就没有太多的字符编码问题，而刚好MaxCompute使用的Python2.7版本的基础库，导致出现一直编码错误的问题，问题虽然最后都解决...
python查看汉字的编码_python有关汉字编码问题
2021-01-14 11:15

一簇金银花的博客查看程序编码方式：sys.getdefaultencoding()查看文件编码方式：1.import chardet 2.f = open('lianxi1-qus.py') data = f.read() print chardet.detect(data)字符编码发展历程：ASCII——(gb2312——(1...
python 对文件编码格式转换小工具
2018-01-29 13:56

小慧慧_的博客做项目的时候一般都用source insight 读源码，有些文件的中文注释的编码方式是utf-8,但是si不支持utf-8编码，网上有些插件可以解决问题，但是都不好用。于是决定自己写一个文件编码转换工具，支持批量和单个文件的...
Python-编码格式
2021-11-30 16:07

胡安民的博客 python3在内存中是用unicode编码方式存储的，所以不能直接储存和传输，要转化为其他编码进行储存和传输。字符串通过编码转换成字节码，字节码通过解码成为字符串转码(都变为字节) encode：str --> bytes 解码...
python3对文件编码的转换处理
2021-03-15 16:05

Python 学习者的博客前言：公司同事邀我一起给SQLSERVER 2008导数，数据来源有高斯和ORACLE, 数据文件保存格式有UTF-8和GBK。当我在做测试导入的时候发现SQL...import chardet source_file = sys.argv[1] # 源文件 dest_file = sy
没有解决我的问题, 去提问

悬赏问题

¥15 安卓adb backup备份应用数据失败
¥15 eclipse运行项目时遇到的问题
¥15 关于#c##的问题：最近需要用CAT工具Trados进行一些开发
¥15 南大pa1 小游戏没有界面，并且报了如下错误，尝试过换显卡驱动，但是好像不行
¥15 没有证书，nginx怎么反向代理到只能接受https的公网网站
¥50 成都蓉城足球俱乐部小程序抢票
¥15 yolov7训练自己的数据集
¥15 esp8266与51单片机连接问题(标签-单片机|关键词-串口)（相关搜索：51单片机|单片机|测试代码）
¥15 电力市场出清matlab yalmip kkt 双层优化问题
¥30 ros小车路径规划实现不了，如何解决？(操作系统-ubuntu)

python3 求问chardet.detect返回网页编码及转码问题

1条回答 默认 最新

悬赏问题

1条回答默认最新