JordingZh 2018-09-20 10:35 采纳率: 0%
浏览 18211

python爬虫如何用beautifulsoup提取多层div标签下的内容

用request提取到的HTMLdiv标签未能展开,用findall方法,传入“div”“类名”做参数,也提取不到任何内容,求教!

  • 写回答

3条回答

  • lyhsdy 2018-09-27 01:04
    关注

    URL是要爬的网址,classname是对应的类名称

    import requests 
    import bs4 
    import re 
    url='https://www.XXXX.com'
    response = requests.get(url).text
    soup = bs4.BeautifulSoup(response,'html.parser')
     for i in soup.findAll(name='div',attrs = {'class':'classname'})       
        print (i)
    
    评论

报告相同问题?

悬赏问题

  • ¥15 数学的三元一次方程求解
  • ¥20 iqoo11 如何下载安装工程模式
  • ¥15 本题的答案是不是有问题
  • ¥15 关于#r语言#的问题:(svydesign)为什么在一个大的数据集中抽取了一个小数据集
  • ¥15 C++使用Gunplot
  • ¥15 这个电路是如何实现路灯控制器的,原理是什么,怎么求解灯亮起后熄灭的时间如图?
  • ¥15 matlab数字图像处理频率域滤波
  • ¥15 在abaqus做了二维正交切削模型,给刀具添加了超声振动条件后输出切削力为什么比普通切削增大这么多
  • ¥15 ELGamal和paillier计算效率谁快?
  • ¥15 蓝桥杯单片机第十三届第一场,整点继电器吸合,5s后断开出现了问题