selenium爬取招聘网站一直刷新主页，代码为什么爬不出来，超时怎么解决？

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
import time
from selenium.common.exceptions import TimeoutException
from pyquery import PyQuery as pq

browser = webdriver.Firefox()
wait = WebDriverWait(browser, 10)

def search():
    try:
        browser.get( 'https://www.simplyhired.com/') #网站url
        browser.implicitly_wait(10)
        input = wait.until(
            EC.presence_of_element_located((By.CSS_SELECTOR, "input.id_f_keywords:nth-child(1)"))#搜索框
        )
        submit = wait.until(EC.element_to_be_clickable((By.CSS_SELECTOR, '.btn-block')))#按钮
        input.send_keys("Information Management")#搜索框中输入
        submit.click()
        get_products()
        browser.implicitly_wait(10)

    except TimeoutException:  # 当网卡超时时，重新执行
        return search()

def next_page():
    try:
        next_page = wait.until(EC.element_to_be_clickable((By.CSS_SELECTOR, 'a.next-pagination')))#下一页按钮
        next_page.click()
    except TimeoutException:  # 当网卡超时时，重新执行
        return search()


def get_products():
    wait.until(EC.presence_of_element_located((By.CSS_SELECTOR, '#content .jobs')))#获取id为content下class为jobs的所有card js-job active
    html = browser.page_source
    print(html)#将html代码打印出来


def mian():
    print("第", 1, "页：")
    search()
    for i in range(2, 20):
        time.sleep(3)
        print("第", i, "页：")
        get_products()



if __name__ == '__main__':
    mian()

拜托哪位大神能教教我呀，小白一个

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答

好学的小师弟 2021-09-21 12:48

关注

def refresh_yemian():
    successful_search = ''
    try:
        time.sleep(1)
        driver.find_element_by_xpath('//*[@id="float"]/th[1]').click()
        time.sleep(1)
        successful_search=print('---查询页面正常，可正常查询车次---')
        time.sleep(1)
    except:
        print('---正在点击查询按钮---',end='\r')
        time.sleep(1)
        driver.find_element_by_xpath('//*[@id="query_ticket"]').click()
        time.sleep(1)
        refresh_yemian()
    return successful_search
#现在这个应该可以刷新页面了，不断地点击按钮，直到刷新出想要的页面

报告相同问题？

关注问题

Python selenium的爬虫无法完整爬取整个页面的内容 python selenium 爬虫
2021-10-24 09:44

回答 1 已采纳爬取内容不完整，应该是文档的更多内容，要往下滑动页面才会出现这个不太清楚，应该不是什么反爬，就是类似于中途给你弹出个广告，要具体分析怎么弄VIP内容肯定是需要你的账号是VIP才能看得到的，与selen
为什么爬取的网站，页面代码少了好多，然后网站显示空白 python 有问必答爬虫
2022-02-19 20:26

回答 3 已采纳你是用requests爬取网页的吗你检查下这个网页中的内容是不是通过js代码读取外部json数据来动态更新的。requests只能获取网页的静态源代码，动态更新的内容取不到。对于动态更新的内容要用s
selenium爬取数据异常 python selenium 爬虫
2022-05-03 21:12

回答 1 已采纳数据在哪就在哪页爬，页面不显示的一般元素没有加载，你自然取不到啊
爬虫：解决动态刷新、基于selenium框架的爬虫、解决登录以及验证码问题（含爬虫模板）
2023-11-11 12:34

货又星的博客本文介绍的是爬虫的相关知识，包括如何解决动态刷新、基于selenium框架的爬虫、解决登录以及验证等问题。通过本文的学习，读者可以进一步提升自己的爬虫技能，更好地应对各种复杂的爬取情况。本文最后附基础爬虫模板...
selenium爬虫遇到VIP页面以及爬取次数限制时该怎么办 python selenium 爬虫
2021-10-24 12:56

回答 1 已采纳遇到VIP页面，我想你应该需要一个VIP会员，并以登入破解。限制爬取次数上，可以用proxy轮转或尽量拉长sleep时间或多办几个账号以上浅见
【python】selenium爬取含企查查中文的网址报405问题 chrome python selenium
2021-09-23 10:04

回答 2 已采纳先进首页，再跳转
python语法中selenium浏览器驱动为什么我的代码中间有一个横线？ python
2022-07-17 19:48

回答 1 已采纳 selenium更新了怕
使用Selenium爬取淘宝商品（绕过登录页面）
2022-04-08 16:23

降温vae+的博客在之前的文章中，我们成功尝试分析Ajax来抓取页面相关数据，但是并不是所有的页面都可以通过分析Ajax来完成抓取。比如，淘宝，它的整个页面数据构造也是用过Ajax获取的，但是这些Ajax接口参数比较复杂，可能会包含...
使用selenium爬取数据时，数据没展开提取不到怎么办？ python
2021-03-07 15:54

回答 2 已采纳两个方法一个是找到后端接口，直接请求后端接口另一个是操作selenium点击加载
selenium爬虫爬取网页信息时出现用户登陆怎么解决？ python 有问必答
2022-08-25 16:21

回答 5 已采纳 emmm，你可以先打开浏览器进行登录，再让selenium接管浏览器：https://blog.csdn.net/qq254271304/article/details/103493969或者你再程序
python selenium在网页切换刷新时find_element容易崩溃，怎么解决？ python selenium
2021-11-12 12:38

回答 3 已采纳关键字 :等待等到元素确实出现在页面中，再进行操作 element = WebDriverWait(driver, 10, 0.1).until( lambda browser:b
python爬虫之使用selenium爬取b站视频信息
2019-06-22 01:11

chenf99的博客前言在之前提到爬虫时，我想到的步骤大多是：查找要爬取内容的页面的url，...但今天我发现了selenium这个工具，selenium是一套完整的web应用程序测试系统，可以用它来模拟真实浏览器进行测试。在爬虫中使用它的...
selenium爬取房源网站 python selenium 有问必答
2022-05-10 21:17

回答 3 已采纳请提供报错信息，从报错行查找原因。
Python中的selenium库做爬虫一些关于元素找不到的问题
2022-10-24 15:03

zkkkkkkkkkkkkk的博客 Python中的selenium库做爬虫一些关于元素找不到的问题出现elementfinderror异常情况大概分为以下几种： 1）查找元素本身不存在 2）元素的页面渲染跟不上速度 3）找到元素但不是最新的（常在首次进入页面刷新后...
Python + selenium 爬取网页信息
2020-09-20 01:14

bingolina的博客最近需要从网页上找一些有用的信息，就简单用python爬了一下。网上方法有很多，request，...因为要爬的网站有的网站的数据为动态加载，这里我用selenium + ChromeDriver来获取页面数据。Selenium，适用于动态刷新网站
没有解决我的问题, 去提问

悬赏问题

¥15 执行 virtuoso 命令后，界面没有，cadence 启动不起来
¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
¥20 有关区间dp的问题求解
¥15 多电路系统共用电源的串扰问题
¥15 slam rangenet++配置
¥15 有没有研究水声通信方面的帮我改俩matlab代码
¥15 ubuntu子系统密码忘记
¥15 信号傅里叶变换在matlab上遇到的小问题请求帮助
¥15 保护模式-系统加载-段寄存器
¥15 电脑桌面设定一个区域禁止鼠标操作

码龄粉丝数原力等级 --

selenium爬取招聘网站一直刷新主页，代码为什么爬不出来，超时怎么解决？

1条回答

码龄粉丝数原力等级 --

悬赏问题