给你说了名字别只写13个字 2021-07-24 10:18 采纳率: 100%
浏览 42
已结题

在命令行里使用python requests.get命令没有事,写成python程序就被识别成机器人了为什么?

在命令行里直接get就能获取信息,写成下面的程序就要人机验证了,这是为什么?


import requests
keyword = "Python"
try:
    kv = {'wd': keyword}
    kv2 = {'user-agent': 'Mozilla/5.0'}
    r = requests.get("http://www.baidu.com/s", params=kv, headers=kv2)
    r.raise_for_status()
    r.encoding = r.apparent_encoding
    print(r.text)
except:
    print("爬取失败")
  • 写回答

2条回答 默认 最新

  • CSDN专家-HGJ 2021-07-24 13:23
    关注

    需要添加Accept和Referer内容到headers,写成如下试试:kv2 = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36', 'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,/;q=0.8,application/signed-exchange;v=b3;q=0.9', 'Referer': 'http://www.baidu.com/s'}

    如有帮助,请点击采纳按钮。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 8月1日
  • 已采纳回答 7月24日
  • 创建了问题 7月24日

悬赏问题

  • ¥30 STM32 INMP441无法读取数据
  • ¥100 求汇川机器人IRCB300控制器和示教器同版本升级固件文件升级包
  • ¥15 用visualstudio2022创建vue项目后无法启动
  • ¥15 x趋于0时tanx-sinx极限可以拆开算吗
  • ¥500 把面具戴到人脸上,请大家贡献智慧
  • ¥15 任意一个散点图自己下载其js脚本文件并做成独立的案例页面,不要作在线的,要离线状态。
  • ¥15 各位 帮我看看如何写代码,打出来的图形要和如下图呈现的一样,急
  • ¥30 c#打开word开启修订并实时显示批注
  • ¥15 如何解决ldsc的这条报错/index error
  • ¥15 VS2022+WDK驱动开发环境