python3 爬虫爬取不规则、带有转义符的json字符串，json.loads()报错

今天学习写爬虫，利用正则表达式爬取的一段网页源代码，代码前面有json.parse

利用正则表达式把gallery一行爬出来是下面的代码：
{\"count\":8,\"sub_images\":[{\"url\":\"http:\/\/p99.pstatp.com\/origin\/pgc-image\/154088560091068452d3c58\",\"width\":1080,\"url_list\":[{\"url\":\"http:\/\/p99.pstatp.com\/origin\/pgc-image\/154088560091068452d3c58\"},{\"url\":\"http:\/\/pb3.pstatp.com\/origin\/pgc-image\/154088560091068452d3c58\"},{\"url\":\"http:\/\/pb1.pstatp.com\/origin\/pgc-image\/154088560091068452d3c58\"}],\"uri\":\"origin\/pgc-image\/154088560091068452d3c58\",\"height\":1918},{\"url\":\"http:\/\/p1.pstatp.com\/origin\/pgc-image\/1540885587029ea96e1c851\",\"width\":690,\"url_list\":[{\"url\":\"http:\/\/p1.pstatp.com\/origin\/pgc-image\/1540885587029ea96e1c851\"},{\"url\":\"http:\/\/pb3.pstatp.com\/origin\/pgc-image\/1540885587029ea96e1c851\"},{\"url\":\"http:\/\/pb9.pstatp.com\/origin\/pgc-image\/1540885587029ea96e1c851\"}],\"uri\":\"origin\/
...........

将其json.loads()之后报错如下：
json.decoder.JSONDecodeError: Expecting property name enclosed in double quotes: line 1 column 2 (char 1)

网上试了HTMLParse，结果后面循环报错，解决不了了。哈哈哈，

有没有大神知道这种情况，怎么处理么？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
devmiao 2018-10-30 11:25
关注
https://blog.csdn.net/shenkunchang1877/article/details/79086886

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python3 爬虫爬取不规则、带有转义符的json字符串，json.loads()报错 python
2018-10-30 10:06

回答 1 已采纳 https://blog.csdn.net/shenkunchang1877/article/details/79086886
python的json.loads如何处理带HTML的字符串 json python 有问必答
2022-02-16 00:15

回答 3 已采纳你已经生成字符串就不好处理了只能用正则表达式把html代码先提取出来,再把html代码中的引号前面加个 \不过这样不太好精确的提取html代码部分最好是能在生成这个字符串时,把html代码拼接进字符串
python爬虫动态网页爬取报错 python 爬虫
2022-11-22 23:06

回答 2 已采纳 news 数据获取错误 import requests import json url = 'https://www.ptpress.com.cn/newsInfo/getCurrentAffairs
Python3-json.dumps()和json.loads()
2021-10-26 17:10

小伟呀的博客对数据进行编码，将Python字典编码成json字符串，是一个系列化的过程。 import json from pprint import pprint def Test(): py_dict = { "A":100, "B":20, "C":30 } json_str = json.dumps(py_dict) print...
Python爬虫时遇到问题： json.decoder.JSONDecodeError: Expecting value: line 1 column 1 (char 0) json python 爬虫
2022-07-23 12:09

回答 3 已采纳
python爬虫时遇到的json.loads()问题 python 爬虫
2021-08-16 17:02

回答 2 已采纳 url中的请求参数 callback=....去掉试试
python里requests.get到的数据.json()出错是怎么回事，求解，急！~ python 有问必答爬虫
2021-10-05 00:13

回答 3 已采纳返回的值不符合json规范，先返回文本，打印内容看看，再做处理。
python 解析json报错_解决python解析非标准json格式字符串loads字典时报错问题
2021-01-28 23:27

Alysa其诗闻的博客读取如下数据想转换成字典json.loads()时报错，用ast模块即可解决。如原始数据格式：{‘tv’: [‘3DDDFC53136993750039653F73F3FC16.1501072660144’, ‘6DA658E6A8B6412ACA4AB81CB48C7448.1506155551158’, ‘3...
爬虫json报错解决方法 python 爬虫
2022-12-09 10:07

回答 1 已采纳 worldDataStr不是标准的json格式，所以用json.loads 会报错
python，怎样把带None的字符串，转成json格式 python 算法
2023-01-13 17:22

回答 2 已采纳可以做字符串替换并用json加载。注意，你的引号使用方式有些问题，下面代码已修正 import json str = '[{"para":"www","value":"None"}]' dat
Golang将字符串转换为单个json值而不是列表，类似于python中的json.loads json
2017-03-07 10:02

回答 1 已采纳 You can use unmarshal the string in a map[string]interface{}. For example https://play.golang.org/
python爬虫+谷歌翻译json字符串
2020-12-15 21:13

我心我行的博客 json字符串只翻译值，不翻译键。 json字符串以文本形式存放，翻译完也要采用文本存放。问题分析 json数据在python中本质上是由多个字典组成的列表；如果只有一个字典，那么也可以是字典。重难点在于如何完整地...
Pandas借助Python爬虫爬取HTML网页表格保存到Excel文件的问题，解答。 python 有问必答
2021-09-20 23:00

回答 2 已采纳没有指定打开方式写为with open("./Gldjc_Pandas.txt","w+") as fin:即可有帮助望采纳~
Python 处理 JSON 数据只会 json.loads? 快来看看这两款工具
2020-09-10 00:55

编程武士的博客 python 官方 json 处理库真的够了吗？跟随作者一步步分析和处理开发实战中遇到的一系列问题，带您逐步了解 demjson 和 python-jsonpath-rw 这两个实用第三方库。
【python】爬虫基础——JSON、requests、BeautifulSoup、lxml、爬取静态网页
2023-09-18 16:02

zz的学习笔记本的博客 JSON是⼀种存储和交换数据的语法JSON仅仅是⽂本，它能够轻松地在服务器浏览器之间传输JSON的数据格式其实就是python里面的字典格式。
python函数——json.loads、dumps、sort()、sorted
2020-06-05 11:37

胖虎是只mao的博客在python中，json的key只能是字符串，即使字典中的key是整数，经过dumps之后，也会成字符串。 1、json.dumps()和json.loads()是json格式处理函数（可以这么理解，json是字符串）　(1)json.dumps()函数是将一个...
python中字符串转xml对象_Python-Json字符串和XML解析
2021-02-09 20:02

慢慢密密麻麻的博客 Python-json字符串和xml解析JSON:JavaScript Object Notation(JavaScript 对象表示法)JSON是存储和交换文本信息的语法，类似XMLJSON比XML更小，更快，更易解析。1、JSON语法与语法规则JSON语法是JavaScript语法的...
「Python系列」Python JSON数据解析
2024-02-26 11:21

雪梅零落的博客在Python中，将数据类型编码为JSON格式时，Python的内置类型会与JSON类型之间有一个自然的映射关系。需要注意的是，一些Python对象类型（如自定义类、集合、日期等）在默认情况下并不能直接转换为JSON类型。模块提供...
【解决】json字符串解析失败json.decoder.JSONDecodeError
2020-07-13 17:14

一只快死的猿的博客最近遇到一个json字符串解析失败的问题，原因是json里面的":,这个三个符合在搞鬼，报错如下： json.decoder.JSONDecodeError: Expecting property name enclosed in double quotes: … json.decoder.JSONDecodeError...
如何解决json字符串解析失败json.decoder.JSONDecodeError
2020-08-08 13:52

测试员小何的博客最近遇到一个json字符串解析失败的问题，原因是json里面的":这个两个符合和一些特殊符号在搞鬼，报错如下： json.decoder.JSONDecodeError: Expecting property name enclosed in double quotes: … json.decoder....
没有解决我的问题, 去提问

悬赏问题

¥15 delta降尺度计算的一些细节，有偿
¥15 Arduino红外遥控代码有问题
¥15 数值计算离散正交多项式
¥30 数值计算均差系数编程
¥15 redis-full-check比较两个集群的数据出错
¥15 Matlab编程问题
¥15 训练的多模态特征融合模型准确度很低怎么办
¥15 kylin启动报错log4j类冲突
¥15 超声波模块测距控制点灯，灯的闪烁很不稳定，经过调试发现测的距离偏大
¥15 import arcpy出现importing _arcgisscripting 找不到相关程序

python3 爬虫爬取不规则、带有转义符的json字符串，json.loads()报错

1条回答 默认 最新

悬赏问题

1条回答默认最新