selenium切换窗口

以下为一段模拟浏览器爬虫的代码，我有15个url，每个都是不一样的，可是我获取的all_content全部是重复，一样的数据，我不知道哪里出了问题，恳请各位帮忙。

import random    
from selenium import webdriver
from lxml import etree
import json
import time
#import time
driver_path='D:\geckodriver.exe'
driver=webdriver.Firefox(executable_path=driver_path)
url="https://www.lagou.com/wn/jobs?kd=Java&city=%E5%85%A8%E5%9B%BD/"    
driver.get(url)
html=etree.HTML(driver.page_source)
script=html.xpath('//script[@id="__NEXT_DATA__"]/text()')[0]
script=json.loads(script)
props=script.get('props')
pageProps=props.get('pageProps')
initData=pageProps.get('initData')
content=initData.get('content')
positionResult=content.get('positionResult')
result=positionResult.get('result')
results=[]
for result1 in result:
    positionId= result1.get('positionId')
    results.append(positionId)

"""以上的代码都是用于导入库，和获取url而写的，可以先忽略不看，
看下面的代码，我是打算通过urls遍历得到每个url的数据，可是得出来都是重复的
"""

urls=[]
for result2 in results:        
    url='https://www.lagou.com/wn/jobs/'+str(result2)+'.html'
    urls.append(url)   
    
all_contents=[]
for url in urls:                                 
    driver.execute_script("window.open('{}')".format(url))
    driver.switch_to.window(driver.window_handles[1])
    html = etree.HTML(driver.page_source)
    job=html.xpath('//span/span[@class="position-head-wrap-position-name"]/text()')
    salary=html.xpath('//span/span[@class="salary"]/text()')
    other=html.xpath('//dd[@class="job_request"]/h3//text()')
    others=''
    for i in other:
        i = i.strip()
        if i=="":
            continue
        elif i=="/":
            continue
        elif '/' in i:
            i=i.replace('/','')
        others+=i+' '
    singles=''    
    single=html.xpath('//dd/div[@class="job-detail"]//text()')
    for b in single:
        b = b.strip()
        if b=="":
            continue
        elif b=="/":
            continue
        elif '/' in b:
            b=b.replace('/','')  
        singles+=b
    all_content={"job":job,"salary":salary,"others":others,"singles":singles}
    all_contents.append(all_content)
    print(all_contents)
    time.sleep(random.uniform(2,4))   
    #driver.close()
   # driver.switch_to.window(driver.window_handles[0])
    #time.sleep(random.uniform(2,4))

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
cjh4312 2023-01-20 21:33
关注
窗口切换不对，要切换到最新打开窗口
driver.switch_to.window(driver.window_handles[-1])

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

selenium切换窗口 python selenium 爬虫
2023-01-20 19:42

回答 2 已采纳窗口切换不对，要切换到最新打开窗口driver.switch_to.window(driver.window_handles[-1])
python爬虫使用selenium切换窗口问题 python selenium 有问必答爬虫
2022-03-18 12:30

回答 2 已采纳 driver.swith_to.window(driver.window_handles[1]),函数名写错了，不是swith是switch，少写了个c，改成：driver.switch_to.win
selenium一旦切换焦点到别的窗口就会检测不到元素 chrome python selenium
2023-02-05 14:29

回答 6 已采纳根据您的问题描述，selenium一旦切换焦点就会报检测不到元素的错误，这里要分情况:如果你在selenium驱动打开的那个浏览器上打开或者关闭了新窗口就会出现这个问题，你可以通过driver.swi
selenium中的多窗口切换
2020-01-04 15:02

Python 学习者的博客在selenium中，我们会遇到一些问题，就是多窗口处理的问题，我们爬取的内容在一个新窗口上，这个时候，我们就需要先切换到这个新的窗口上，然后进行抓取内容。如何切换呢？首先，获取当前窗口句柄 1.元素有属性，...
Python selenium窗口截图时的报错 python selenium 有问必答
2021-09-09 10:24

回答 3 已采纳建议该检查一下测试用例的代码从日志来看，已经输出了“已截图已保存”，那么说明take_screenshot 已经执行完毕了此外，selenium的源码如下 def get_screenshot_a
使用selenium库定位不到页面元素 python selenium 开发语言
2022-10-02 13:22

回答 2 已采纳文章：Selenium 元素定位正确，但始终报找不到元素错误中也许有你想要的答案，请看下吧
pyinstaller打包selenium问题 python selenium
2022-04-26 23:30

回答 1 已采纳如果想不弹出命令行窗口，可以在打包的时候加上-w参数这个参数代表使用Windows子系统执行.当程序启动的时候不会打开命令行(只对Windows有效)
Selenium用法详解【窗口表单切换】【JAVA爬虫】
2023-01-07 14:39

泰山AI的博客本文主要讲解java 代码利用Selenium如何实现控制浏览器进行窗口切换和页面内的不同表单之间的切换操作。
Selenium启动驱动失败，如何关掉对应打开的浏览器窗口 python selenium
2022-07-11 18:00

回答 1 已采纳如果通过driver不能关掉浏览器窗口，你可以尝试一下python自带的system库去杀掉浏览器对应的进程，
selenium跳转到新页面中的句柄问题 python selenium
2021-10-21 10:53

回答 1 已采纳句柄就是一个窗口的ID。倒数第三行就是切换driver窗口，句柄高低不太清楚，一般是后打开的窗口句柄处于最后一个（最高）划掉的代码你移到上面会有提示，估计是说这个方法即将被弃用，建议你使用另一个切换窗
selenium跨域请求问题 javascript python selenium 有问必答
2022-06-10 16:49

回答 3 已采纳添加那个选项后可以跨域的，题主怎么用的，示例代码如下需要注意获取返回值要return TB(url) from selenium import webdriver import time opt =
selenium高级自动化编程
2020-11-27 15:21

小桃子的思念的博客提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、环境准备二、webdriver操作浏览器的基本方法元素定位前言提示：这里可以添加本文要记录的大概内容： ...cmd窗口
Python爬虫编程6——selenium
2022-02-18 11:13

彩色的泡沫的博客目录爬虫和反爬虫的斗争爬虫建议 ajax基本介绍 ... 获取ajax数据的方式 ...一.Selenium+...打开多窗口和切换页面特征识别和设置无头窗口 selenium常用的js操作二.图形验证码识别 Tesseract安装以及操作
Selenium详细介绍
2022-10-31 11:14

H e的博客 Selenium测试脚本可以使用任何支持的编程语言进行编码，并且可以直接在大多数现代 Web 浏览器中运行。在爬虫领域 selenium 同样是一把利器，能够解决大部分的网页的反爬问题。主要用于自动化测试、爬虫模拟人操作...
selenium学习指南
2022-08-09 16:43

Ciao228的博客 Selenium组织提供了多种 编程语言的Selenium客户端库，包括 java，python，js， ruby等，方便不同编程语言的开发者使用。我们只需要安装好客户端库，调用这些库，就可以发出自动化请求给浏览器。总结一下，...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 1月29日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 1月21日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 1月20日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月20日

悬赏问题

¥100 set_link_state
¥15 虚幻5 UE美术毛发渲染
¥15 CVRP 图论物流运输优化
¥15 Tableau online 嵌入ppt失败
¥100 支付宝网页转账系统不识别账号
¥15 基于单片机的靶位控制系统
¥15 真我手机蓝牙传输进度消息被关闭了，怎么打开？(关键词-消息通知)
¥15 装 pytorch 的时候出了好多问题，遇到这种情况怎么处理？
¥20 IOS游览器某宝手机网页版自动立即购买JavaScript脚本
¥15 手机接入宽带网线，如何释放宽带全部速度

selenium切换窗口

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新