读书会变好看 2020-12-28 23:04 采纳率: 0%
浏览 213
已结题

Python爬虫,为什么正则化后返回的是空?

import requests
import re
url = "https://maoyan.com/board/4"
headers = {
        "User-Agent":"Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.88 Safari/537.36"
    }

response = requests.get(url,headers=headers)

html=response.content.decode("utf-8")
print(html)


pattern = re.compile(
    '<dd>.*?board-index.*?>(.*?)</i>.*?data-src="(.*?)".*?name.*?a.*?>(.*?)</ a>.*?star.*?>(.*?)</p >.*?releasetime.*?>(.*?)</p >.*?integer.*?>(.*?)</i>.*?fraction.*?>(.*?)</i>.*?</dd>',re.S
    )
items = re.findall(pattern,html)
print(items)

得到了网页的源代码,但是用正则化解析的时候为什么返回的是空?刚开始学爬虫,请多多指教。

  • 写回答

2条回答 默认 最新

  • dzhaoll1001 2020-12-29 15:33
    关注

    html原文是什么

    评论

报告相同问题?

问题事件

  • 已结题 (查看结题原因) 8月31日

悬赏问题

  • ¥100 需要跳转番茄畅听app的adb命令
  • ¥50 寻找一位有逆向游戏盾sdk 应用程序经验的技术
  • ¥15 请问有用MZmine处理 “Waters SYNAPT G2-Si QTOF质谱仪在MSE模式下采集的非靶向数据” 的分析教程吗
  • ¥50 opencv4nodejs 如何安装
  • ¥15 adb push异常 adb: error: 1409-byte write failed: Invalid argument
  • ¥15 nginx反向代理获取ip,java获取真实ip
  • ¥15 eda:门禁系统设计
  • ¥50 如何使用js去调用vscode-js-debugger的方法去调试网页
  • ¥15 376.1电表主站通信协议下发指令全被否认问题
  • ¥15 物体双站RCS和其组成阵列后的双站RCS关系验证