qq_41556290 2019-01-25 10:16 采纳率: 0%
浏览 500

怎么爬取最近5期数字?帮忙看一下哪里写的不对请指教

怎么爬取最近5期数字? 爬的是空壳[],帮忙看一下哪里写的不对请指教
是不是json格式,需要动态Ajax加载页面爬

图片说明

import re
import requests

def parse_page(url):
headers = {
'User-Agent': "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/62.0.3202.94 Safari/537.36"
}
response = requests.get(url,headers)
text = response.text

titles = re.findall(r'

.*?
(.*?)
',text,re.S) #dlh-ctn-list-numx dlh-ctn-list-num-item-outter
print(titles)
# dynasties = re.findall(r'

.*?(.*?)',text,re.S)

# authors = re.findall(r'

.*?(.*?)',text,re.S)
# poem_tags = re.findall(r'

(.*?)
',text,re.S) #dlh-ctn-list-num-item-right
poem_tags = re.findall(r'
(.*?)
', text, re.DOTALL)
print(poem_tags)

def main():
url = "https://m.941509.cn/public/views/jssaiche/detail.html"
parse_page(url)

if name == '__main__':
main()
图片说明
爬的是空壳[]
动态Ajax加载页面怎么爬
图片说明

  • 写回答

2条回答 默认 最新

  • 萌新开车了 2019-01-25 10:28
    关注

    直接取出他们的父标签,遍历五次不就好了吗图片说明

    评论

报告相同问题?

悬赏问题

  • ¥15 高价求中通快递查询接口
  • ¥15 解决一个加好友限制问题 或者有好的方案
  • ¥15 关于#java#的问题,请各位专家解答!
  • ¥15 急matlab编程仿真二阶震荡系统
  • ¥20 TEC-9的数据通路实验
  • ¥15 ue5 .3之前好好的现在只要是激活关卡就会崩溃
  • ¥50 MATLAB实现圆柱体容器内球形颗粒堆积
  • ¥15 python如何将动态的多个子列表,拼接后进行集合的交集
  • ¥20 vitis-ai量化基于pytorch框架下的yolov5模型
  • ¥15 如何实现H5在QQ平台上的二次分享卡片效果?