陈锬 2021-03-07 15:54 采纳率: 50%
浏览 311
已采纳

使用selenium爬取数据时,数据没展开提取不到怎么办?

1.这是代码

from time import sleep
from selenium import webdriver
import time
import random
import csv

import pandas as pd
# 驱动文件路径
driverfile_path = r'C:\Users\cctcs\AppData\Local\Google\Chrome\Application\chromedriver.exe'
# driver=webdriver.Chrome()
# 启动浏览器
driver = webdriver.Chrome(executable_path=driverfile_path)
driver.maximize_window() # 浏览器窗口最大化
driver.get(r'https://voice.baidu.com/act/newpneumonia/newpneumonia?fraz=partner&paaz=gjyj')


text = driver.find_element_by_xpath('//div[@id="ptab-1"]')
print(text.text)

2.这是代码爬取出的数据

3.爬取的网页:

使用谷歌浏览器打开,网址是:https://voice.baidu.com/act/newpneumonia/newpneumonia?fraz=partner&paaz=gjyj

4.这是要爬取的数据

因为这网页本身数据没有展开所以爬取不到展开里面的内容。求大佬指教!!!

  • 写回答

2条回答 默认 最新

  • 放风喽 2021-03-07 19:08
    关注

    两个方法一个 是找到后端接口,直接请求后端接口

    另一个是操作selenium点击加载

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
  • 放风喽 2021-03-07 22:23
    关注

    text = driver.find_element_by_xpath('//div[@id="ptab-1"]')

    这句话的意思是通过xpath获取标签,

    还有其他的 ,比如

    continue_link = driver.find_element_by_link_text('Continue')

    continue_link = driver.find_element_by_partial_link_text('Conti')

    你的这个网页就是

    element = driver.find_element_by_partial_link_text(''展开全部").click()

    获取按钮的同时,直接点击。

    评论
查看更多回答(1条)

报告相同问题?

悬赏问题

  • ¥15 (关键词-聊天软件)
  • ¥15 求大家看看这个编程的编法没有思路啊
  • ¥20 WSL打开图形化程序子窗口无法点击
  • ¥15 Jupyter Notebook 数学公式不渲染
  • ¥20 ERR_CACHE_MISS 确认重新提交表单
  • ¥20 关于vba使用HTMLfile执行js函数问题
  • ¥60 悬赏求解,通过实时现场摄像头的视频图像识别其他对家打出的麻将牌,识别麻将牌,识别牌墙位置,通过识别对家打出了什么牌
  • ¥15 关于#GPU jetson#的pcie驱动开发问题,如何解决?
  • ¥15 stm32f103zet6 串口5无法收发数据
  • ¥15 关于C语言使用线程队列实现多线程并发