webdriver进一步爬取京东商品信息

各位大佬好：
刚接触python,想用webdriver实现爬取京东商品信息，举个例子：在京东首页搜索手机会显示许多商品结果，我想在搜索出来的基础（商品价钱，商品链接，商品店铺链接）上根据这个“商品店铺链接”进一步爬取这个店铺里面的信息，请问我的思路是否可行（不一定非要用webdriver），如果可行能否指导下怎么进入这个商品店铺链接悬赏可以修改这是我的代码：


from selenium import webdriver
from selenium.webdriver.common.keys import Keys
import time


# noinspection SyntaxError
def get_good(driver):
    try:

        # 通过JS控制滚轮滑动获取所有商品信息
        js_code = '''
            window.scrollTo(0,5000);
        '''
        driver.execute_script(js_code)  # 执行js代码

        # 等待数据加载
        time.sleep(2)

        # 3、查找所有商品div
        # good_div = driver.find_element_by_id('J_goodsList')
        good_list = driver.find_elements_by_class_name('gl-item')
        n = 1
        for good in good_list:
            # 根据属性选择器查找
            # 商品链接
            good_url = good.find_element_by_css_selector(
                '.p-img a').get_attribute('href')

            # 商品名称
            good_name = good.find_element_by_css_selector(
                '.p-name em').text.replace("\n", "--")

            # 商品价格
            good_price = good.find_element_by_class_name(
                'p-price').text.replace("\n", ":")

            # 评价人数
            good_commit = good.find_element_by_class_name(
                'p-commit').text.replace("\n", " ")
            # 店铺连接
        #try:
            shop_url = good.find_element_by_css_selector(
                '.p-shop a').get_attribute('href')
        #except OSError:
            pass
            # 店铺名称
        #try:
            shop_name = good.find_element_by_css_selector(
                '.p-shop a').get_attribute('title')

        #except OSError:
            pass
            good_content = f'''
                        商品链接: {good_url}
                        商品名称: {good_name}
                        商品价格: {good_price}
                        评价人数: {good_commit}
                        店铺名称: {shop_url}
                        店铺连接: {shop_name}
                        \n
                        '''
            #qianjian = '旗舰店'
        #if qianjian in shop_name:
         #   print('旗舰店不要')
        #else:
            print(good_content)
            with open('jd.txt', 'a', encoding='utf-8') as f:
                f.write(good_content)

        next_tag = driver.find_element_by_class_name('pn-next')
        next_tag.click()
   # except AttributeError:
       # pass
      #  raise Exception("a must not be zero")
        time.sleep(2)

        # 递归调用函数
        get_good(driver)

        time.sleep(10)

    finally:
        driver.close()


if __name__ == '__main__':

    good_name = input('请输入爬取商品信息:').strip()

    driver = webdriver.Firefox()
    #driver.implicitly_wait(10)
    # 1、往京东主页发送请求
    driver.get('https://www.jd.com/')

    # 2、输入商品名称，并回车搜索
    input_tag = driver.find_element_by_id('key')
    input_tag.send_keys(good_name)
    input_tag.send_keys(Keys.ENTER)
    time.sleep(2)

    get_good(driver)

ps：环境:python3.7 需要引入下浏览器驱动，我用的火狐（45.0.2）引入的驱动是：geckodriver-v0.15.0

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
dabocaiqq 2019-07-09 17:53
关注
https://blog.csdn.net/wokwn/article/details/79175389

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

scrapy-爬取京东笔记本电脑信息问题 chrome python selenium 开发语言
2020-09-01 19:12

回答 2 已采纳 ``` browser.quit() return HtmlResponse(url=request.url, body=browser.page_source, re
爬虫爬取京东怎么实现翻页 python 有问必答
2021-05-18 10:19

回答 3 已采纳这是我之前写的，你看一下 # coding=utf-8 import requests import re import io import sys reload(sys) sys.setdefa
爬取京东商品查询并保存至数据库，昨天还可以用，今天就gg了，把存储部分删除发现就能顺利执行，求解 python 有问必答
2021-06-19 09:29

回答 5 已采纳 sql = "insert into product()value(" + sku + ','+ price + ','+ commit + ',' + url + ",)"; 你的sql有问题啊
python爬取京东商品信息_python爬虫：爬取京东商品信息
2020-12-04 12:13

weixin_40008969的博客 ‘‘‘初级版‘‘‘import timefrom selenium import webdriverfrom selenium.webdriver.common.keys import Keysdriver = webdriver.Chrome(r‘C:\Users\Auraro\Desktop/chromedriver.exe‘)num = 1try:driver....
python webdriver 使用异常 chrome python selenium 有问必答
2022-01-20 15:20

回答 4 已采纳你的 Chrome 已经升级了，但 ChromeDriver 还是旧的，控制不了你的浏览器了。去下一个新的ChromeDriver Message: session not created: Th
如何使用python webdriver 定位到这个网页的输入框<input>？ python
2021-12-28 17:49

回答 1 已采纳 find_element_by_xpath ()鼠标右键复制xpath即可如有帮助请采纳，有问题私信我哦🙈🙈
python爬虫html获取不全 html python 爬虫
2022-06-24 19:43

回答 1 已采纳其实有的，但是这个网站应该是为了懒加载把url用base64密了一下，然后再动态加载，其实我下面发的这个就是url 是base64后的url 解码后就是https://s1.aigei.com/
python爬虫爬取京东商品评价_python爬取京东商品信息及评论
2021-02-10 18:54

周含露的博客 '''爬取京东商品信息:功能: 通过chromeDrive进行模拟访问需要爬取的京东商品详情页(https://item.jd.com/100003196609.html)并且程序支持多个页面爬取，输入时以逗号分隔，思路: 创建webdriver对象并且调用get方法...
python爬虫翻页爬取的数据是第一页的重复数据 python 爬虫问答团队
2021-12-18 19:23

回答 1 已采纳爬下一页就好了
python webdriver get打不开网址 python selenium 有问必答
2022-09-13 16:17

回答 5 已采纳 url前面加上 https://
为什么爬虫无法爬取信息 python 有问必答爬虫
2022-03-25 00:17

回答 2 已采纳你的代码有问题把，你苹果13 也不应该出的来结果啊。good 后面怎么.driver ？ msg 不带text 能看到明文？
python爬取京东商品信息_使用selenium爬取京东商品信息
2020-12-10 06:19

weixin_39626690的博客今天我来分享一下如何使用Python的selenium库爬取京东商品信息。京东商品页面的每个商品都有商品名字，价格，店家信息，和评论数量等关于商品的信息，我要爬取的就是这些信息，通过商品名字，来获取一类商品的商品...
用python爬取数据出错 python selenium 有问必答爬虫
2022-01-06 18:29

回答 2 已采纳那不很明显吗, 底层少包, 用pip安装 openpyxl
Python爬取京东商品信息
2020-10-30 20:56

别叫我名字20的博客 *使用Python爬取京东华为手机前十页的所有商品的链接、名称、价格、评价数以及店铺名称。 1.前期准备（1）下载驱动我使用的是谷歌浏览器，所以要下载谷歌驱动，用来告诉电脑在哪打开浏览器驱动文件下载地址：...
python爬取商品信息_python爬虫：爬取京东商品信息
2020-11-26 03:41

weixin_39524439的博客 '''初级版'''import timefrom selenium import webdriverfrom selenium.webdriver.common.keys import Keysdriver = webdriver.Chrome(r'C:\Users\Auraro\Desktop/chromedriver.exe')num = 1try:driver.implicitly_...
没有解决我的问题, 去提问

悬赏问题

¥15 关于#matlab#的问题：在模糊控制器中选出线路信息，在simulink中根据线路信息生成速度时间目标曲线（初速度为20m/s，15秒后减为0的速度时间图像）我想问线路信息是什么
¥15 banner广告展示设置多少时间不怎么会消耗用户价值
¥16 mybatis的代理对象无法通过@Autowired装填
¥15 可见光定位matlab仿真
¥15 arduino 四自由度机械臂
¥15 wordpress 产品图片 GIF 没法显示
¥15 求三国群英传pl国战时间的修改方法
¥15 matlab代码代写，需写出详细代码，代价私
¥15 ROS系统搭建请教（跨境电商用途）
¥15 AIC3204的示例代码有吗，想用AIC3204测量血氧，找不到相关的代码。

webdriver进一步爬取京东商品信息

2条回答 默认 最新

悬赏问题

2条回答默认最新