JordingZh 2018-09-20 10:35 采纳率: 0%
浏览 18217

python爬虫如何用beautifulsoup提取多层div标签下的内容

用request提取到的HTMLdiv标签未能展开,用findall方法,传入“div”“类名”做参数,也提取不到任何内容,求教!

  • 写回答

3条回答 默认 最新

  • lyhsdy 2018-09-27 01:04
    关注

    URL是要爬的网址,classname是对应的类名称

    import requests 
    import bs4 
    import re 
    url='https://www.XXXX.com'
    response = requests.get(url).text
    soup = bs4.BeautifulSoup(response,'html.parser')
     for i in soup.findAll(name='div',attrs = {'class':'classname'})       
        print (i)
    
    评论

报告相同问题?

悬赏问题

  • ¥15 深度学习根据CNN网络模型,搭建BP模型并训练MNIST数据集
  • ¥15 lammps拉伸应力应变曲线分析
  • ¥15 C++ 头文件/宏冲突问题解决
  • ¥15 用comsol模拟大气湍流通过底部加热(温度不同)的腔体
  • ¥50 安卓adb backup备份子用户应用数据失败
  • ¥20 有人能用聚类分析帮我分析一下文本内容嘛
  • ¥15 请问Lammps做复合材料拉伸模拟,应力应变曲线问题
  • ¥30 python代码,帮调试,帮帮忙吧
  • ¥15 #MATLAB仿真#车辆换道路径规划
  • ¥15 java 操作 elasticsearch 8.1 实现 索引的重建