selenium爬取淘宝翻页不成功，有大佬帮下忙吗

from time import sleep
from selenium import webdriver
from selenium.webdriver.support.ui import WebDriverWait
from bs4 import BeautifulSoup

def login_info():
    #通过扫码的形式去登录淘宝账号
    browser.find_element_by_xpath('//*[@id="login"]/div[1]/i').click()
    sleep(5)
    #点击淘宝首页
    taobao_index = browser.find_element_by_xpath('//*[@id="J_SiteNavHome"]/div/a')
    taobao_index.click()
    sleep(1)
def search_product(value):
    # 标签定位
    search_input = browser.find_element_by_id('q')
    # 标签交互
    search_input.send_keys(value)
    # 执行一组js程序，拉到页面底部
    browser.execute_script('window.scrollTo(0,document.body.scrollHeight)')
    sleep(2)
    # 点击搜索按钮
    btn = browser.find_element_by_css_selector('.btn-search')
    btn.click()
def data(value):
    #获取商品信息

    shop_name_list = []
    shop_price_list = []
    shop_people_list = []
    shop_location_list = []
    a = 0
    b = 0
    for i in range(1,3):
        page = browser.page_source
        soup = BeautifulSoup(page, 'lxml')
        shop_data_list = soup.find('div', class_='grid g-clearfix').find_all_next('div', class_='items')
        for shop_data in shop_data_list:
            # 商品名称
            shop_image_data = shop_data.find_all('div',class_='pic')
            for shop_data_a in shop_image_data:
                shop_data_a = shop_data_a.find_all('a',class_='pic-link J_ClickStat J_ItemPicA')
                for shop_name in shop_data_a:
                    shop_name = shop_name.find_all('img')[0]['alt']
                    shop_name_list.append(shop_name)
            # 商品价格
            shop_price_data = shop_data.find_all('div',class_='price g_price g_price-highlight')
            for shop_price in shop_price_data:
                shop_price_list.append(shop_price.text.strip())
            # 付款人数
            shop_people_number_data = shop_data.find_all('div',class_='deal-cnt')
            for shop_people_number in shop_people_number_data:
                shop_people_list.append(shop_people_number.text)
            #地址
            shop_location_data = shop_data.find_all('div',class_='location')
            for shop_location in shop_location_data:
                shop_location_list.append(shop_location.text)
        # 执行一组js程序，拉到页面底部
        browser.execute_script('window.scrollTo(0,document.body.scrollHeight)')
        sleep(2)
        shop_data = zip(shop_name_list,shop_price_list,shop_people_list,shop_location_list)
        for data in shop_data:
            print(data)
            a += 1
        browser.get(f"https://s.taobao.com/search?q={value}&s={b}")
        b += 44
    print('已成功爬取：%s条信息'%a)

if __name__ == '__main__':
    browser = webdriver.Chrome(executable_path='./chromedriver')

    taobao_index = browser.get('https://login.taobao.com/member/login.jhtml')
    # 窗口最大化
    browser.maximize_window()
    wait = WebDriverWait(browser, 10)
    login_info()
    value = input("请输入你要查询的关键词：")
    search_product(value)
    data(value)

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN专家-孙老师 2021-04-17 12:20
关注
data中不是循环了两次吗？所以最多爬取两页的数据。有一个问题，

browser.get(f"https://s.taobao.com/search?q={value}&s={b}") b += 44

这两条语句的顺序反了，先改变b的值，再去get。

建议可以通过模拟点击翻页按钮来爬取。
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(3条)

报告相同问题？

关注问题

爬虫入门经典(十四) | 使用selenium尝试爬取豆瓣图书
2020-10-30 10:45

不温卜火的博客但由于水平有限，博客中难免会有一些错误出现，有纰漏之处恳请各位大佬不吝赐教！暂时只在csdn这一个平台进行更新，博客主页：https://buwenbuhuo.blog.csdn.net/。 PS：由于现在越来越多的人未经本人同意直接...
Python爬虫 | Selenium爬取当当畅销图书排行
2021-07-03 00:16

Python进阶者的博客点击上方“Python爬虫与数据挖掘”，进行关注回复“书籍”即可获赠Python从入门到进阶共10本电子书今日鸡汤江汉曾为客，相逢每醉还。专栏作者：霖hero，在职爬虫工程师，熟...
python-selenium爬取摩点客户购买信息（前端分析+爬虫代码）
2022-04-08 00:12

隰有游龙的博客前言最近公司需要摩点的用户购买数据，但网站没有下载渠道网上搜了搜发现了selenium库，以前没有用过，还挺有意思就用这个了
Selenium自动化爬取某东商品信息
2022-01-25 10:00

长浪破风的博客个人在家闲来无事，想写个爬虫爬取一下某东的信息，但是一般的简易爬虫无法请求到某东的源代码，加上只是个人练手之作，所以决定用了号称"万物可爬"的selenium模块，力求爬取到自己想要的数据。提示：以下是本篇...
Python+selenium+Xpath爬取百度学术文章摘要
2019-11-22 17:44

Growing_Snake的博客由于研究需要，想要用Glove训练一些自己的领域语料，可是没有现成的语料，所以想着找一些相关文献的摘要作为语料，但总不能自己去找吧~带着万分的不情愿，硬着头皮爬一下百度学术吧（观察发现这个最好爬，对不住了）...
selenium自动翻页
2021-09-13 22:26

贪玩的学渣12138的博客生活中，很多同学由于看课，不想自己翻页而烦恼。简单学习了selenium后，我觉得可以改变一下现状。今天我们使用selenium+chrome浏览器来完成自动翻页，解放双手。目录文章目录前言一、selenium是什么...
使用Selenium爬取动态表格中的多语言和编码格式
2025-11-19 14:23

鲸 Blue的博客本文介绍使用Selenium Python爬取动态表格数据的完整方案。通过配置Firefox浏览器驱动和代理设置，实现自动翻页、切换多语言和编码格式，获取完整表格数据并保存为CSV文件。Selenium能有效处理JavaScript渲染页面，...
【求助贴】python+selenium如何实现点击按钮查看更多评论？试过各种方法了qwq
2024-01-08 18:12

无畏cleaner的博客卑微毕业大学生狂肝论文ing，跪求大佬帮忙OTZ
Python爬虫爬取全部商品页的商品信息并实现自动翻页
2023-05-01 15:28

Yrui.的博客那么困扰我几天的问题什么呢，我没办法实现爬虫获取完第一页的数据后，自己跳转向下一页，我原本做了个driver的点击函数，用以自己跳转下一页，但最后只能跳转到第二页就开始会有报错，我仔细观察了网站在新的一页里...
python_selenium&零基础爬虫学习案例_知网文献信息
2024-01-08 23:52

Hooray11的博客那这是我初学selenium第一次做的实际案例，体验感还是很不错的。虽然中间的过程也很艰辛，就是在不断地去思考下一步怎么做，虽然是根据别的博主的案例来学习的，但是我也尽量的以自己现在的一个学习状况来完成这些...
没有解决我的问题, 去提问

selenium爬取淘宝翻页不成功，有大佬帮下忙吗

4条回答 默认 最新

4条回答默认最新