匹诺曹的鲸 2021-12-16 14:44 采纳率: 50%
浏览 47
已结题

scrapy中运行selemium填写验证码,browser启动后语句不执行

我在做一个招标网的爬虫
http://bs.gdggzy.org.cn/osh-web/project/projectbulletin/bulletinList?queryType=1&orgCode=gd&tradeTypeId=GovernmentProcurement&tradeItemId=zf_res_bulletin
每隔一段时间进入网站就需要填写验证码,所以我想每一次运行scrapy时先判断网站需不需要填验证码,如果需要,就用selenium截图上传验证码识别平台来通过验证,并获得当前网页cookie来向下一个parse传递
我的selenium代码是写在start_request中的

    def start_requests(self):
        for url in self.start_urls:
            driver_path = 'C:/Users/AppData/Local/Google/Chrome/Application/chromedriver.exe'
            options = webdriver.ChromeOptions()
            options.add_experimental_option('excludeSwitches', ['enable-automation'])
            browser = webdriver.Chrome(executable_path=driver_path, options=options)
            browser.get(url=url)
            WebDriverWait(browser, 10, 0.2).until(lambda x: x.find_element_by_xpath("//head//title"))
      
      往下就是获取验证码截图、上传图片、输入验证码的操作
      

我看日志的话就是执行完上面那段打开了浏览器,浏览器显示页面后秒关,下面的代码没有执行,这是为什么呢?

  • 写回答

1条回答 默认 最新

  • CSDN专家-黄老师 2021-12-16 17:18
    关注

    你在代码加个print()看看具体执行到哪一步

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 1月12日
  • 已采纳回答 1月4日
  • 修改了问题 12月16日
  • 修改了问题 12月16日
  • 展开全部

悬赏问题

  • ¥17 pro*C预编译“闪回查询”报错SCN不能识别
  • ¥15 微信会员卡接入微信支付商户号收款
  • ¥15 如何获取烟草零售终端数据
  • ¥15 数学建模招标中位数问题
  • ¥15 phython路径名过长报错 不知道什么问题
  • ¥15 深度学习中模型转换该怎么实现
  • ¥15 Stata外部命令安装问题求帮助!
  • ¥15 从键盘随机输入A-H中的一串字符串,用七段数码管方法进行绘制。提交代码及运行截图。
  • ¥15 如何用python向钉钉机器人发送可以放大的图片?
  • ¥15 matlab(相关搜索:紧聚焦)