Python爬虫，为什么正则化后返回的是空？

import requests
import re
url = "https://maoyan.com/board/4"
headers = {
        "User-Agent":"Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.88 Safari/537.36"
    }

response = requests.get(url,headers=headers)

html=response.content.decode("utf-8")
print(html)


pattern = re.compile(
    '<dd>.*?board-index.*?>(.*?)</i>.*?data-src="(.*?)".*?name.*?a.*?>(.*?)</ a>.*?star.*?>(.*?)</p >.*?releasetime.*?>(.*?)</p >.*?integer.*?>(.*?)</i>.*?fraction.*?>(.*?)</i>.*?</dd>',re.S
    )
items = re.findall(pattern,html)
print(items)

得到了网页的源代码，但是用正则化解析的时候为什么返回的是空？刚开始学爬虫，请多多指教。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
dzhaoll1001 2020-12-29 15:33
关注
html原文是什么

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python爬虫，当正则表达式无法匹配，怎么输出空字符 python 有问必答正则表达式爬虫
2021-09-01 16:19

回答 3 已采纳使用try except环绕即可
正则表达式返回结果为空列表，请问怎么解决？ python 爬虫
2022-08-05 10:54

回答 3 已采纳 import requests import re headers = {"User-Agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebK
python爬虫xpath解析返回为空有什么解决方法吗 python 爬虫
2021-12-10 11:12

回答 1 已采纳为空的地方xpath主要是为了拿到什么数据，贴一下网页和要拿到的数据，帮你写一下xpath。上面图上的xpath那么长那么绝对路径，大概率拿不到数据的。
初识Python爬虫，使用正则表达式提取数据
2024-10-19 22:54

学成大数据前不改名！的博客正则：用来匹配字符产的一门表达式语言1.正则支持普通字符2.元字符，即一个符号匹配部分对应内容\d 匹配0-9的数字 \d\d 一行提取2个数字\w 匹配数字、字母、下划线（0-9、a-z、_）\W \w取反\D \d取反[abc] 自定义...
python爬虫request后返回值为空 chrome python 有问必答爬虫
2022-01-27 16:25

回答 2 已采纳接口需要post请求并发送数据，题主get请求没用改下面就可以了，注意不能采集太快，有防火墙会拦截。。-_-||。。。 import requests import time headers =
python爬虫返回的html文件打开网页是空的 python
2022-06-15 23:07

回答 1 已采纳很正常，一个网页能运行，不但需要html文件，还需要css和js文件在背后支撑。（前端和后端）你只是爬下来了一个html文件，自然什么都不会展示出来。你仔细想想，如果这么轻易的就能被你爬到百度的htm
Python爬虫正则表达式 python
2022-07-22 09:38

回答 3 已采纳
Python网络爬虫-re正则匹配数据
2024-04-24 11:21

程序小勇的博客 re是一种强大的文本处理工具，它使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。...例如，在Python中，可以使用re模块来使用正则表达式。正则表达式的主要应用包括：数据验证、搜索和替换操作等。
python 爬虫正则表达式打印遇到问题 python 正则表达式爬虫
2021-12-30 23:54

回答 2 已采纳 ulrs = re.findall('<img src="(.*?)" alt=".*?">', html) 改成这样就行了，有帮助的话采纳一下哦！谢谢！
python如何正则匹配空格之间的数字？ python 正则表达式
2022-04-30 01:28

回答 1 已采纳 #!/usr/bin/python # -*- coding: UTF-8 -*- """ @author: Roc-xb """ import re if __name__ == '__mai
关于python爬虫利用正则表达式爬取不到内容的问题 python 数据挖掘机器学习正则表达式
2019-10-18 08:20

回答 3 已采纳爬虫内容解析比较方便的不是正则而是 xpath ，语法也很容易，建议试试这种： ``` from lxml import etree # 解析页面的模块 html = etree.HTML
Python爬虫基础-正则表达式！
2024-11-05 17:13

Python_trys的博客正则表达式是对字符串的一种逻辑公式，用事先定义好的一些特定字符、及这些特定字符的组合，组成一个“规则的字符串”，此字符串用来表示对字符串的一种“过滤”逻辑。正在在很多开发语言中都存在，而非python独有。...
python爬虫，为什么使用cookie后会，网页会返回403？ python 有问必答
2021-04-10 20:07

回答 4 已采纳对网站的多次请求时，要模仿浏览器浏览的一样，要有时间间隔不能过于频繁，尽量把请求头写全写对，针对题主的问题，1.csrf_token的获取要从页面分析着手，主要是在页面代码中meta 或其他地方找；二
[Python从零到壹] 四.网络爬虫之入门基础及正则表达式抓取博客案例
2020-09-30 21:07

Eastmount的博客欢迎大家来到“Python从零到壹”，在这里我将分享约200篇Python系列文章，带大家一起去学习和玩耍...第四篇文章将开启网络爬虫之旅，首先介绍基础知识及正则表达式的爬虫，希望对您有所帮助，文章中不足之处也请海涵。
Python爬虫 - 大数据 - 人工智能.zip
2024-01-20 12:49

爬虫（Web Crawler）是一种自动化程序，用于从互联网上收集信息。其主要功能是访问网页、提取数据并存储，以便后续分析或展示。爬虫通常由搜索引擎、数据挖掘工具、监测系统等应用于网络数据抓取的场景。爬虫的...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 8月31日

悬赏问题

¥100 需要跳转番茄畅听app的adb命令
¥50 寻找一位有逆向游戏盾sdk 应用程序经验的技术
¥15 请问有用MZmine处理 “Waters SYNAPT G2-Si QTOF质谱仪在MSE模式下采集的非靶向数据” 的分析教程吗
¥50 opencv4nodejs 如何安装
¥15 adb push异常 adb: error: 1409-byte write failed: Invalid argument
¥15 nginx反向代理获取ip，java获取真实ip
¥15 eda：门禁系统设计
¥50 如何使用js去调用vscode-js-debugger的方法去调试网页
¥15 376.1电表主站通信协议下发指令全被否认问题
¥15 物体双站RCS和其组成阵列后的双站RCS关系验证

Python爬虫，为什么正则化后返回的是空？

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新