dapengdahan 2021-09-23 10:04 采纳率: 100%
浏览 200
已结题

【python】selenium爬取含企查查中文的网址报405问题

代码如下,访问不含中文的网页没有问题,但是如果网址中带中文就会报405;
刚开始我以为是编码的问题,设置成了UTF-8,但依然还是报错。烦请帮忙看下是什么问题。
经过测试,只有企查查有这个问题,百度中文传参的网址可以正常访问。
怀疑是企查查含有反爬检测导致,但奈何才疏学浅,实在没找到解决办法。

# -*- coding: utf-8 -*-
import atexit 
from selenium import webdriver
import time

@atexit.register
def quitDriver():
    print("我执行了!")
    #关闭驱动
    driver.quit()

chrome_options = webdriver.ChromeOptions()

#https网页设置
chrome_options.add_argument('--allow-running-insecure-content')

#设置默认编码
chrome_options.add_argument('lang=zh_CN.UTF-8')

driver = webdriver.Chrome(executable_path=r'D:\新建文件夹\python\chromedriver.exe',options=chrome_options)

driver.get('''https://www.qcc.com/web/search?key=大连市中心医院''')
print(driver.title)

time.sleep(20)

  • 写回答

2条回答 默认 最新

  • jones-zhuo 2021-09-23 10:44
    关注

    先进首页,再跳转

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 10月2日
  • 已采纳回答 9月24日
  • 修改了问题 9月23日
  • 创建了问题 9月23日

悬赏问题

  • ¥200 csgo2的viewmatrix值是否还有别的获取方式
  • ¥15 Stable Diffusion,用Ebsynth utility在视频选帧图重绘,第一步报错,蒙版和帧图没法生成,怎么处理啊
  • ¥15 请把下列每一行代码完整地读懂并注释出来
  • ¥15 pycharm运行main文件,显示没有conda环境
  • ¥15 易优eyoucms关于二级栏目调用的问题
  • ¥15 寻找公式识别开发,自动识别整页文档、图像公式的软件
  • ¥15 为什么eclipse不能再下载了?
  • ¥15 编辑cmake lists 明明写了project项目名,但是还是报错怎么回事
  • ¥15 关于#计算机视觉#的问题:求一份高质量桥梁多病害数据集
  • ¥15 特定网页无法访问,已排除网页问题