chiqian2971 2020-03-16 20:40 采纳率: 50%
浏览 3352

python selenium 无头模式下 报错403 <!-- a padding to disable MSIE and Chrome friendly error page -->

在 正常浏览器弹出模式下是正常可以获取到源码的。但是在无头模式下 出现错误。
无头模式配置如下

# 创建chrome参数对象
options = webdriver.ChromeOptions()
options.add_argument('--no-sandbox') # 解决DevToolsActivePort文件不存在的报错
options.add_argument('window-size=1600x900') # 指定浏览器分辨率
options.add_argument('--disable-gpu') # 谷歌文档提到需要加上这个属性来规避bug
options.add_argument('--hide-scrollbars') # 隐藏滚动条, 应对一些特殊页面
options.add_argument('blink-settings=imagesEnabled=false') # 不加载图片, 提升速度
options.add_argument('--headless') # 浏览器不提供可视化页面. linux下如果系统不支持可视化不加这条会启动失败

     browser.get("https://www.apple.com.cn/")
print(browser.page_source)

试了百度,apple 都可以正常输出源码,但是就一个网址报错,报错内容如下



html><head><title>403 Forbidden</title></head>


403 Forbidden



Apple

这是什么原因 求解。 怎么才能爬取呢?
我是要想在centos 服务器上运行这个脚本的 ,但是爬取不到。

  • 写回答

1条回答 默认 最新

  • ZOUHUIJIANG 2021-01-07 18:35
    关注

    请问下您的问题解决了嘛,我也遇到了同样的问题,这是什么原因造成的呢?

    评论

报告相同问题?

悬赏问题

  • ¥30 这是哪个作者做的宝宝起名网站
  • ¥60 版本过低apk如何修改可以兼容新的安卓系统
  • ¥25 由IPR导致的DRIVER_POWER_STATE_FAILURE蓝屏
  • ¥50 有数据,怎么建立模型求影响全要素生产率的因素
  • ¥50 有数据,怎么用matlab求全要素生产率
  • ¥15 TI的insta-spin例程
  • ¥15 完成下列问题完成下列问题
  • ¥15 C#算法问题, 不知道怎么处理这个数据的转换
  • ¥15 YoloV5 第三方库的版本对照问题
  • ¥15 请完成下列相关问题!