patter1 2021-02-14 01:03 采纳率: 33.3%
浏览 39

爬取内容看不到网络表格内容如何爬取?

http://fund.eastmoney.com/data/fundranking.html#tall;c0;r;s6yzf;pn50;ddesc;qsd20200213;qed20210213;qdii;zq;gg;gzbd;gzfs;bbzt;sfbb

使用BeautifulSoup爬取下的内容中并没有发现列表中内容,什么原因,应该如何爬取?

  • 写回答

1条回答 默认 最新

  • coagenth 2021-02-14 02:20
    关注

    使用requests只能爬取静态网页,因是js动态加载的所以你得不到想要的结果,要借助selenium 才能获取表格数据。

    import pandas as pd

    from selenium import webdriver

    options=webdriver.ChromeOptions()

    options.add_argument('--headless')

    driver=webdriver.Chrome(options=options)

    driver.get(url)

    driver.implicitly_wait(5)

    df = pd.read_html(driver.page_source)[3]

    print(df)

    评论

报告相同问题?

悬赏问题

  • ¥15 请各位帮我看看是哪里出了问题
  • ¥15 vs2019的js智能提示
  • ¥15 关于#开发语言#的问题:FDTD建模问题图中代码没有报错,但是模型却变透明了
  • ¥15 uniapp的h5项目写一个抽奖动画
  • ¥15 TeleScan不能修改bar
  • ¥100 请问我基于逐飞库写的这个有关于mp u6050传感器的函数,为什么输出的值是固定的?
  • ¥15 hadoop中启动hive报错如下怎么解决
  • ¥15 如何优化QWebEngineView 加载url的速度
  • ¥15 关于#hadoop#的问题,请各位专家解答!
  • ¥15 如何批量抓取网站信息