你回来吧我有钱了 2021-09-12 10:56 采纳率: 55.6%
浏览 18
已结题

Python获取HTML页面代码和直接访问的代码不一样问题

img

img

为什么用浏览器访问和pycharm访问获取网页的源代码内容不一样?是因为百度识别到我这是利用Python来访问的页面的吗

  • 写回答

1条回答 默认 最新

  • wo.austin 2021-09-12 18:30
    关注
    1. 你直接请求一个地址拿到的仅仅是这个地址的结果。
      浏览器访问这个页面,你可以看看同时请求了多少地址。
    2. 百度搜索肯定会有用户行为分析。
      识别爬虫后,就给你错误的资源,或者不给你资源。
      你想想,如果这么容易让你拿到搜索结果了,那肯定就有许多人基于百度搜索结果包装另外做搜索了,那百度国内也不会有这么大的市场份额了。
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 10月30日
  • 已采纳回答 10月22日
  • 创建了问题 9月12日