Amme_ 2023-07-19 11:23 采纳率: 75%
浏览 40

爬取网页数据,结果显示为空如何解决?

我想用python爬取微博热搜榜的数据,思路是先解码网页源代码(decode),再用正则表达式(re)匹配,但是输出显示为空

import requests
import re
headers={
    "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36 Edg/114.0.1823.82"
         }
response=requests.get("https://s.weibo.com/top/summary?cate=realtimehot"
                  ,headers=headers)
info=response.content.decode('utf-8','ignore')
content=re.findall(r'<td class="td-02">\s*<a href="(.*?)".target="_blank">(.*?)</a>',info,re.S)
print(content)

img


请问是哪一步做错了呢?😣

  • 写回答

3条回答 默认 最新

  • hahai1212 2023-07-19 11:34
    关注

    不知道啊。你确定你拿到了网页的信息吗

    评论

报告相同问题?

问题事件

  • 修改了问题 7月19日
  • 创建了问题 7月19日

悬赏问题

  • ¥15 复杂网络,变滞后传递熵,FDA
  • ¥20 csv格式数据集预处理及模型选择
  • ¥15 部分网页页面无法显示!
  • ¥15 怎样解决power bi 中设置管理聚合,详细信息表和详细信息列显示灰色,而不能选择相应的内容呢?
  • ¥15 QTOF MSE数据分析
  • ¥15 平板录音机录音问题解决
  • ¥15 请问维特智能的安卓APP在手机上存储传感器数据后,如何找到它的存储路径?
  • ¥15 (SQL语句|查询结果翻了4倍)
  • ¥15 Odoo17操作下面代码的模块时出现没有'读取'来访问
  • ¥50 .net core 并发调用接口问题