Amme_ 2023-07-19 11:23 采纳率: 75%
浏览 54

爬取网页数据,结果显示为空如何解决?

我想用python爬取微博热搜榜的数据,思路是先解码网页源代码(decode),再用正则表达式(re)匹配,但是输出显示为空

import requests
import re
headers={
    "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36 Edg/114.0.1823.82"
         }
response=requests.get("https://s.weibo.com/top/summary?cate=realtimehot"
                  ,headers=headers)
info=response.content.decode('utf-8','ignore')
content=re.findall(r'<td class="td-02">\s*<a href="(.*?)".target="_blank">(.*?)</a>',info,re.S)
print(content)

img


请问是哪一步做错了呢?😣

  • 写回答

3条回答 默认 最新

  • hahai1212 2023-07-19 11:34
    关注

    不知道啊。你确定你拿到了网页的信息吗

    评论

报告相同问题?

问题事件

  • 修改了问题 7月19日
  • 创建了问题 7月19日