litongya 2021-08-28 23:09 采纳率: 33.3%
浏览 51

Python爬某宝这个正则怎么写?

url = 'https://sf.某宝.com/item_list.htm?&category=50025969&city=%D6%A3%D6%DD&page=1'
获取到了网页代码,需要获取中间的列表数据在下面这段代码里。

<script id="sf-item-list-data" type="text/json">
{"data":[xxxxxxxxxx]
}</script>

我写的是:

list = re.findall(r'<script id="sf-item-list-data" type="text/json">\s\S"data":(.*?)}</script>', response.txt)[0]

可是一直出错,得到的都是空列表list:[],请问应该怎么写才能正确匹配到数据?

中间的 ‘ \s\S ’ 是因为我觉得前面代码中有一个换行,可能还有空格,所以用\s代替换行或者空格之类,\S是因为前面还有个 ‘ { ’ 号,用\S替代。不知道这里这样写对不对。

  • 写回答

2条回答 默认 最新

  • Smart-Space 2021-08-29 08:27
    关注

    将你的正则匹配代码中添加第三个参数re.S试一试

    评论

报告相同问题?

问题事件

  • 修改了问题 8月30日
  • 修改了问题 8月28日
  • 修改了问题 8月28日
  • 创建了问题 8月28日

悬赏问题

  • ¥200 csgo2的viewmatrix值是否还有别的获取方式
  • ¥15 Stable Diffusion,用Ebsynth utility在视频选帧图重绘,第一步报错,蒙版和帧图没法生成,怎么处理啊
  • ¥15 请把下列每一行代码完整地读懂并注释出来
  • ¥15 pycharm运行main文件,显示没有conda环境
  • ¥15 寻找公式识别开发,自动识别整页文档、图像公式的软件
  • ¥15 为什么eclipse不能再下载了?
  • ¥15 编辑cmake lists 明明写了project项目名,但是还是报错怎么回事
  • ¥15 关于#计算机视觉#的问题:求一份高质量桥梁多病害数据集
  • ¥15 特定网页无法访问,已排除网页问题
  • ¥50 如何将脑的图像投影到颅骨上