用python+chromedriver 爬取网站商品页面时，遇到403问题

用python+chromedriver 爬取网站商品页面时，遇到403问题
这个该怎么修改才能够正常显示商品页面啊？？

但是如果访问网站首页，代码可以正常运行。

import time
from pathlib import Path

from anti_useragent import UserAgent
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from selenium.webdriver.chrome.service import Service

options = Options()
options.add_argument("--disable-blink-features=AutomationControlled")     
options.add_argument("--disable-extensions")          
options.add_argument("--disable-features=Translate")                 
options.add_argument("--disable-popup-blocking")                                     
# options.add_argument("--headless=new")                                               
options.add_argument("--hide-scrollbars")                                              
options.add_argument("--ignore-certificate-errors")                  
options.add_argument("--incognito")                       
options.add_argument("--mute-audio")                   
options.add_argument("--no-default-browser-check")         
options.add_argument("--propagate-iph-for-testing")        
options.add_argument("--start-maximized")       
options.add_argument("--user-agent=" + UserAgent("windows").chrome)          
options.add_argument("--window-position=100,100")                                  
options.add_argument("--window-size=1600,1024")                                   
options.add_experimental_option("excludeSwitches", ["enable-automation", "enable-logging"]) 

service = Service()
driver = webdriver.Chrome(service=service, options=options)
s=driver.get('https://iyec.itoyokado.co.jp/front/commodity/0004/00018944/') 
time.sleep(20)
driver.quit()

显示的是

<html style="height:100%"><head><META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW"><meta name="format-detection" content="telephone=no"><meta name="viewport" content="initial-scale=1.0"><meta http-equiv="X-UA-Compatible" content="IE=edge,chrome=1"><script type="text/javascript" src="/_Incapsula_Resource?SWJIYLWA=719d34d31c8e3a6e6fffd425f7e032f3"></script><script src="/oid-our-hope-it-my-then-good-Recomfor-the-digge-" async></script></head><body style="margin:0px;height:100%"><iframe id="main-iframe" src="/_Incapsula_Resource?CWUDNSAI=23&xinfo=4-45362685-0%20NNNN%20RT%281700390988954%209%29%20q%280%20-1%20-1%202%29%20r%280%20-1%29%20B15%2814%2c0%2c0%29%20U24&incident_id=433001140076330935-262689854938225796&edet=15&cinfo=0e00000072a6&rpinfo=0&cip=115.163.85.169&mth=GET" frameborder=0 width="100%" height="100%" marginheight="0px" marginwidth="0px">Request unsuccessful. Incapsula incident ID: 433001140076330935-262689854938225796</iframe></body></html>

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
玥轩_521 新星创作者: 网络协议与安全技术领域 2023-11-19 19:37
关注
要解决这个问题，您可以尝试以下方法：

使用代理服务器。这可以帮助您绕过网站的IP限制。您可以使用免费或付费的代理服务器。以下是如何使用代理服务器的示例：

from selenium import webdriver from selenium.webdriver.chrome.options import Options proxy = "your_proxy_server:port" chrome_options = Options() chrome_options.add_argument(f'--proxy-server={proxy}') driver = webdriver.Chrome(options=chrome_options) driver.get('https://iyec.itoyokado.co.jp/front/commodity/0004/00018944/') time.sleep(20) driver.quit()

更改User-Agent。有些网站会检查User-Agent，如果发现是爬虫，可能会拒绝请求。您可以尝试更改User-Agent，使其看起来像是正常的浏览器访问。以下是如何更改User-Agent的示例：

from selenium import webdriver from selenium.webdriver.chrome.options import Options from anti_useragent import UserAgent ua = UserAgent() chrome_options = Options() chrome_options.add_argument(f'--user-agent={ua.random}') driver = webdriver.Chrome(options=chrome_options) driver.get('https://iyec.itoyokado.co.jp/front/commodity/0004/00018944/') time.sleep(20) driver.quit()

如果以上方法都无法解决问题，您可能需要联系网站管理员，询问他们是否有针对爬虫的限制。有时，网站会限制某些爬虫的行为，以防止滥用。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python+selenium+chromedriver实现爬虫示例代码
2020-09-17 14:06

Selenium 是一个强大的Web应用程序测试框架，它支持多种编程语言，包括Python。它的工作原理是通过控制浏览器来执行各种操作，这些操作可以是导航、元素定位、交互等。Selenium 支持多种浏览器，如 Chrome、Firefox...
Python+selenium爬取工人日报内容
2025-04-25 16:28

在本篇内容中，我们将会讲解如何使用Python编程语言结合Selenium自动化测试工具，针对工人日报网站进行内容的爬取。爬虫技术不仅能够帮助我们快速获取所需信息，而且在数据挖掘、市场分析等方面也发挥着不可或缺的...
Python+Selenium爬取知网论文数据
2026-01-09 16:56

Python是一种广泛使用的高级编程语言，以其清晰的语法和强大的功能而闻名，尤其适合数据处理和自动化任务。Selenium是一个自动化测试工具，它可以模拟用户的行为在网页上进行操作，非常适合于进行网页数据的爬取。...
使用selenium+chromedriver+xpath爬取动态加载信息
2022-02-09 09:51

Bruce_xiaowei的博客使用selenium+chromedriver+xpath爬取动态加载的信息使用selenium实现动态渲染页面的爬取，selenium是浏览器自动化测试框架，是一个用于Web应用程序测试的工具，可以直接运行在浏览器当中，并可以驱动浏览器执行...
Python+Selenium爬取动态加载页面（1）
2019-05-07 15:36

嗨学编程的博客建议安装Python3的版本，一般来说越新越好。这是官网下载安装，或者网上其它教程。安装Selenium和其一些必要的包： pip install pandas pip install bs4 pip install selenium 2、详细爬取过程 2.1 分析待...
(Win10) 使用 Selenium + Python + Chrome 爬取数据并存入 MySQL 的尝试
2019-01-31 17:23

geekqian的博客如题, 最近在使用 Selenium + Python 实现爬取数据的操作, 学学新姿势. 所以开一篇新的博客来记录一下. 先上个效果图直观感受下. 开始前的准备参考资料: ...安装Python3 这个略过, 没装的自己去网上搜教程. ...
Python+selenium 职位信息爬取
2023-05-09 16:22

本文将深入探讨如何使用Python结合Selenium来爬取集团招聘网站的职位信息，并利用正则表达式进行数据过滤。首先，Python是一种高级编程语言，以其简洁、易读的语法和丰富的库支持而闻名。在数据处理和网络爬虫领域...
使用Python和Selenium爬取京东商品数据
2024-07-16 11:45

0dayNu1L的博客 ❤❤码农不是吗喽（大学生版）-CSDN博客在本文中，我们将探讨如何使用Python编程语言结合Selenium库来爬取京东网站上的商品数据。Selenium是一个强大的工具，可以模拟真实用户对网页的交互操作，非常适合进行网页...
python3 selenium + fiddler 爬取动态js页面数据
2019-10-14 20:47

Python编程KK的博客抓取动态页面js加载的人民日报里面的新闻详情 https://wap.peopleapp.com/news/1 先打开，然后查看网页源码，发现是一堆js，并没有具体的每个新闻的url详情，于是第一反应，肯定是js动态加载拼接的url。然后接着按...
Python+Selenium爬取动态加载页面（2）
2019-05-07 15:38

嗨学编程的博客全国水雨情网的数据同样是动态加载出来的，在浏览中打开网页后http://xxfb.hydroinfo.gov.cn/ssIndex.html，可以看到回下图1-1所示的页面。图1-1 全国水雨情网可以看到，其中并没有显示任何的数据，如果我们...
Python爬取淘宝商品信息[项目代码]
2025-11-12 16:06

本文将详细介绍如何利用Python编程语言及其相关库来实现淘宝商品信息的自动化爬取。首先，为了实现自动化浏览器操作，我们需要借助Selenium库，它是一个强大的自动化测试工具，可以模拟真实用户的浏览器行为，从而...
python + selenium +pyquery 爬虫爬取 1688详情图片阿里巴巴详情图片与标题下载图片并进行压缩仅供学习交流使用 .zip
2019-08-17 23:27

Python是一种广泛应用于Web开发、数据分析和自动化测试等领域的高级编程语言。在爬虫技术中，Python扮演着核心角色，因为它提供了丰富的库支持网络数据抓取。在这个项目中，我们使用了Python结合Selenium和PyQuery来...
超强干货之---Python-数据爬取（爬虫）
2024-07-12 17:01

.房东的猫的博客特点递归：通常用递归实现，或者使用栈来模拟递归过程。内存占用低：在有大量分支的情况下，内存占用比广度优先搜索低。适合目标较深的情况：如果目标节点距离起始节点较深，DFS能更快找到目标。适用场景需要遍历...
selenium+python爬取简书文章_selenium 如何连同文章样式一块爬取
2024-05-06 15:10

2401_84140302的博客 selenium是一个web自动化测试工具，支持很多种语言，我们在这里可以使用python的selenium做爬虫使用，爬取简书的过程中，它的工作原理是不断注入js代码，让页面源源不断的加载，最后再提取所有的a标签。首先你得在...
Python+selenium+Xpath爬取百度学术文章摘要
2019-11-22 17:44

Growing_Snake的博客由于研究需要，想要用Glove训练一些自己的领域语料，可是没有现成的语料，所以想着找一些相关文献的摘要作为语料，但总不能自己去找吧~带着万分的不情愿，硬着头皮爬一下百度学术吧（观察发现这个最好爬，对不住了）...
chromedriver+chrome安装包
2022-01-22 13:44

它允许程序员通过编写Python等编程语言来控制Chrome浏览器，进行网页爬取、网页自动化操作，如登录、点击、填写表单等。在描述中提到的"chromedriver+chrome+python爬虫、自动化办公等需要配置的软件"，意味着这个...
Python爬虫开发：爬取编程问答网站高频问题分析系统
2025-05-02 11:30

Python爬虫项目的博客通过本文的实现，我们展示了如何使用Python爬虫技术爬取编程问答网站上的高频问题，并进行数据分析和可视化。这些技术不仅可以帮助开发者发现当前技术领域的热点问题，也为进一步的学习和研究提供了有力支持。未来，...
python编程之selenium+chromedriver批量获取资源资源链接
2020-08-13 13:17

宛如一个zz蛤的博客我们需要用到selenium作为自动化工具，这里建议使用pycharm作为我们的开发工具，在File->Settings->Project Interpreter中添加selenium package，这样就可以在项目中import selenium了。如果不使用pycharm，...
【python】教你使用seLeniun爬取淘宝商品数据（内含完整源码）
2021-12-18 16:04

魔王不会哭的博客使用python采集某宝商品数据 [课题介绍]：随着互联网时代的到来，人们更加倾向于互联网购物某宝又是电商行业的巨头，在某宝平台中有很多商家数据今天带大家使用python+selenium工具获取这些公开的商家数据 [环境...
Python 基于 Selenium 爬取招聘岗位信息的基础程序.zip
2024-01-17 10:37

Python是一种广泛应用于Web开发、数据分析、人工智能等多个领域的高级编程语言，因其简洁明了的语法而深受程序员喜爱。在本教程中，我们将深入探讨如何利用Python的Selenium库来爬取招聘网站上的岗位信息。Selenium...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 11月19日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 11月19日

用python+chromedriver 爬取网站商品页面时，遇到403问题

2条回答 默认 最新

问题事件

2条回答默认最新