dapengdahan 2021-09-23 10:04 采纳率: 100%
浏览 191
已结题

【python】selenium爬取含企查查中文的网址报405问题

代码如下,访问不含中文的网页没有问题,但是如果网址中带中文就会报405;
刚开始我以为是编码的问题,设置成了UTF-8,但依然还是报错。烦请帮忙看下是什么问题。
经过测试,只有企查查有这个问题,百度中文传参的网址可以正常访问。
怀疑是企查查含有反爬检测导致,但奈何才疏学浅,实在没找到解决办法。

# -*- coding: utf-8 -*-
import atexit 
from selenium import webdriver
import time

@atexit.register
def quitDriver():
    print("我执行了!")
    #关闭驱动
    driver.quit()

chrome_options = webdriver.ChromeOptions()

#https网页设置
chrome_options.add_argument('--allow-running-insecure-content')

#设置默认编码
chrome_options.add_argument('lang=zh_CN.UTF-8')

driver = webdriver.Chrome(executable_path=r'D:\新建文件夹\python\chromedriver.exe',options=chrome_options)

driver.get('''https://www.qcc.com/web/search?key=大连市中心医院''')
print(driver.title)

time.sleep(20)

  • 写回答

2条回答 默认 最新

  • jones-zhuo 2021-09-23 10:44
    关注

    先进首页,再跳转

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 10月2日
  • 已采纳回答 9月24日
  • 修改了问题 9月23日
  • 创建了问题 9月23日

悬赏问题

  • ¥15 关于#matlab#的问题:在模糊控制器中选出线路信息,在simulink中根据线路信息生成速度时间目标曲线(初速度为20m/s,15秒后减为0的速度时间图像)我想问线路信息是什么
  • ¥15 banner广告展示设置多少时间不怎么会消耗用户价值
  • ¥16 mybatis的代理对象无法通过@Autowired装填
  • ¥15 可见光定位matlab仿真
  • ¥15 arduino 四自由度机械臂
  • ¥15 wordpress 产品图片 GIF 没法显示
  • ¥15 求三国群英传pl国战时间的修改方法
  • ¥15 matlab代码代写,需写出详细代码,代价私
  • ¥15 ROS系统搭建请教(跨境电商用途)
  • ¥15 AIC3204的示例代码有吗,想用AIC3204测量血氧,找不到相关的代码。