爬取网页数据，结果显示为空如何解决？

我想用python爬取微博热搜榜的数据，思路是先解码网页源代码（decode），再用正则表达式（re)匹配，但是输出显示为空

import requests
import re
headers={
    "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36 Edg/114.0.1823.82"
         }
response=requests.get("https://s.weibo.com/top/summary?cate=realtimehot"
                  ,headers=headers)
info=response.content.decode('utf-8','ignore')
content=re.findall(r'<td class="td-02">\s*<a href="(.*?)".target="_blank">(.*?)</a>',info,re.S)
print(content)

请问是哪一步做错了呢？😣

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
hahai1212 2023-07-19 11:34
关注
不知道啊。你确定你拿到了网页的信息吗

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python使用xpath爬取网络数据报表结果为空 python 开发语言有问必答
2021-10-23 17:12

回答 3 已采纳该页面数据在XHR中找，构建一下headers和params，使用如下方式获json数据，然后从中解析即可： response = requests.get('https://fr.oppein.co
python爬取到的网页文本，保存本地txt显示文件为空？什么原因呢？ python 有问必答
2022-04-07 11:17

回答 3 已采纳 w改为a（追加），要不会将当前写入的内容覆盖文件内容要么将open和close放到for循环外
正则表达式返回结果为空列表，请问怎么解决？ python 爬虫
2022-08-05 10:54

回答 3 已采纳 import requests import re headers = {"User-Agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebK
零代码编程：用ChatGPT爬取网页数据遇到乱码怎么办？
2023-05-29 11:33

零代码编程：用ChatGPT爬取网页数据遇到乱码怎么办？
python爬虫,爬取的数据异常，如何解决？ python 爬虫
2023-02-22 21:55

回答 3 已采纳这个问题在于html_data()函数中的return语句放在了for循环内部，这导致函数只能返回第一个电影的信息。把return语句缩进移动到for循环之外，这样才能返回整个页面的电影信息。另外，s
为什么爬取CSDN热搜存MySQL为空？如何解决 python
2021-08-12 15:48

回答 1 已采纳没有报错？还是爬取的结果为空？或者数据库表存在？字段类型对应？首先看是爬取问题还是数据库存储问题
pycharm爬取的内容显示空白 python
2021-04-13 21:35

回答 2 已采纳查看网页源代码可以发现这是动态加载的，通过这样根本爬取不到信息，可以考虑使用selenium模块试试
基于Python编程语言的水文数据爬取设计源码
2024-10-01 07:42

本项目是一款基于Python编程语言的水文数据爬取系统源码，总计包含80个文件，涵盖51个xlsx数据文件、9个pyc编译文件、7个Python源文件、5个xml配置文件、2个txt文本文件、1个gitignore忽略文件、1个iml项目文件、1个...
如何在爬取网页数据时用多线程？（python） python 有问必答
2021-05-12 18:21

回答 6 已采纳可以使用concurrent.futures的ThreadPoolExecutor，用一个线程池执行异步调用。例： import requests from bs4 import Beautifu
selenium爬虫爬取网页信息时出现用户登陆怎么解决？ python 有问必答
2022-08-25 16:21

回答 5 已采纳 emmm，你可以先打开浏览器进行登录，再让selenium接管浏览器：https://blog.csdn.net/qq254271304/article/details/103493969或者你再程序
爬取网页表格数据到excel后，excel上没有数据？ python
2023-04-10 02:32

回答 4 已采纳结论：1、你的url是错误的。至少格式上来就错了。（https://liansai.500.com/zuqiu-6296/jifen-17831/2023-04-10&page=1）；2、col2之后
python爬虫爬取网页数据并解析数据
2020-09-24 10:46

当爬取网页数据时，首先需要使用requests库发送GET请求到目标网页的URL，然后获取返回的状态码、响应内容等。获取到的数据可以通过BeautifulSoup库进行解析，提取出所需的具体HTML标签内容。例如，可以定位到特定的...
为什么爬取到的内容和网页上的不一样呢？求解决方法 python 爬虫
2022-05-12 17:10

回答 2 已采纳因为他是异步加载的。解决方法：1、一般爬取到的内容和网页上的不一样，可能是请求异常或者是异步加载导致的，需要去定位数据来源。2、打开控制台全局搜索151.4，发现没结果，那么继续搜索1514，发现有
爬取TIOBE的编程语言排行榜
2021-01-21 16:50

最近，本人打算搞一个编程语言排名的可视化，需要数据，于是就从TIOBE上爬了一些数据。下面我来分享一下我的思路，思路仅供参考，可能有更好的方法，如果小伙伴们有好方法，可以在评论区留言哦。本次爬取的目标：...
Python大数据之从网页上爬取数据的方法详解
2020-09-18 11:11

在当今的数据驱动时代，从网页上爬取数据成为了获取信息和分析数据的重要手段，Python作为一种功能强大的编程语言，因其简洁的语法和丰富的库支持，成为开发网络爬虫的首选语言之一。本篇文章主要介绍了如何使用...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 7月19日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月19日

悬赏问题

¥15 复杂网络，变滞后传递熵，FDA
¥20 csv格式数据集预处理及模型选择
¥15 部分网页页面无法显示！
¥15 怎样解决power bi 中设置管理聚合，详细信息表和详细信息列显示灰色，而不能选择相应的内容呢？
¥15 QTOF MSE数据分析
¥15 平板录音机录音问题解决
¥15 请问维特智能的安卓APP在手机上存储传感器数据后，如何找到它的存储路径?
¥15 (SQL语句|查询结果翻了4倍)
¥15 Odoo17操作下面代码的模块时出现没有'读取'来访问
¥50 .net core 并发调用接口问题

爬取网页数据，结果显示为空如何解决？

3条回答 默认 最新

问题事件

悬赏问题

3条回答默认最新