qq_41556290 2019-01-25 10:16 采纳率: 0%
浏览 500

怎么爬取最近5期数字?帮忙看一下哪里写的不对请指教

怎么爬取最近5期数字? 爬的是空壳[],帮忙看一下哪里写的不对请指教
是不是json格式,需要动态Ajax加载页面爬

图片说明

import re
import requests

def parse_page(url):
headers = {
'User-Agent': "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/62.0.3202.94 Safari/537.36"
}
response = requests.get(url,headers)
text = response.text

titles = re.findall(r'

.*?
(.*?)
',text,re.S) #dlh-ctn-list-numx dlh-ctn-list-num-item-outter
print(titles)
# dynasties = re.findall(r'

.*?(.*?)',text,re.S)

# authors = re.findall(r'

.*?(.*?)',text,re.S)
# poem_tags = re.findall(r'

(.*?)
',text,re.S) #dlh-ctn-list-num-item-right
poem_tags = re.findall(r'
(.*?)
', text, re.DOTALL)
print(poem_tags)

def main():
url = "https://m.941509.cn/public/views/jssaiche/detail.html"
parse_page(url)

if name == '__main__':
main()
图片说明
爬的是空壳[]
动态Ajax加载页面怎么爬
图片说明

  • 写回答

2条回答

  • 萌新开车了 2019-01-25 10:28
    关注

    直接取出他们的父标签,遍历五次不就好了吗图片说明

    评论

报告相同问题?

悬赏问题

  • ¥15 C#读写EXCEL文件,不同编译
  • ¥15 如何提取csv文件中需要的列,将其整合为一篇完整文档,并进行jieba分词(语言-python)
  • ¥15 MapReduce结果输出到HBase,一直连接不上MySQL
  • ¥15 扩散模型sd.webui使用时报错“Nonetype”
  • ¥15 stm32流水灯+呼吸灯+外部中断按键
  • ¥15 将二维数组,按照假设的规定,如0/1/0 == "4",把对应列位置写成一个字符并打印输出该字符
  • ¥15 NX MCD仿真与博途通讯不了啥情况
  • ¥15 win11家庭中文版安装docker遇到Hyper-V启用失败解决办法整理
  • ¥15 gradio的web端页面格式不对的问题
  • ¥15 求大家看看Nonce如何配置