关注
码龄
粉丝数
原力等级 --
被采纳
被点赞
采纳率
你回来吧我有钱了
2021-09-12 10:56
采纳率: 55.6%
浏览 18
首页
Python
已结题
Python获取HTML页面代码和直接访问的代码不一样问题
python
后端
为什么用浏览器访问和pycharm访问获取网页的源代码内容不一样?是因为百度识别到我这是利用Python来访问的页面的吗
收起
写回答
好问题
0
提建议
关注问题
微信扫一扫
点击复制链接
分享
邀请回答
编辑
收藏
删除
收藏
举报
1
条回答
默认
最新
关注
码龄
粉丝数
原力等级 --
被采纳
被点赞
采纳率
wo.austin
2021-09-12 18:30
关注
你直接请求一个地址拿到的仅仅是这个地址的结果。
浏览器访问这个页面,你可以看看同时请求了多少地址。
百度搜索肯定会有用户行为分析。
识别爬虫后,就给你错误的资源,或者不给你资源。
你想想,如果这么容易让你拿到搜索结果了,那肯定就有许多人基于百度搜索结果包装另外做搜索了,那百度国内也不会有这么大的市场份额了。
本回答被题主选为最佳回答
, 对您是否有帮助呢?
本回答被专家选为最佳回答
, 对您是否有帮助呢?
本回答被题主和专家选为最佳回答
, 对您是否有帮助呢?
解决
无用
评论
打赏
微信扫一扫
点击复制链接
分享
举报
评论
按下Enter换行,Ctrl+Enter发表内容
查看更多回答(0条)
向“C知道”追问
报告相同问题?
提交
关注问题
使用
Python
3
获取
网页源
代码
2022-12-23 21:57
大秦重工的博客
爬虫的数据爬取量非常大,显然不可能对每个
页面
都手动复制源
代码
,因此就有必要使用自动化的方式来
获取
网页源
代码
。
爬取的
html
和网页不一样原因,网页爬虫 - 【如图】
python
爬取的
html
页面
和浏览器显示源码的结果不同...
2021-06-22 21:41
薇同学的博客
1、在浏览器中右键点击
页面
,选:审查元素查看网页源码2、在
python
3 程序中对比:import reptn_tr = re.compile(r']+>')import requests as reqrsp=req.get('http://www.
python
scraping.com/pages...
前端运行
python
代码
几种方式_前端和
python
2020-11-24 09:56
weixin_39572794的博客
如果您细心对比过 json
python
sdk 和 xml
python
sdk 的文档,您会发现并不是一个简单的增量更新。 xml
python
sdk 在架构、可用性和安全性上有了非常大的提升,而且在易用性、健壮性和传输性能上也做了非常大的...
关于
Python
:8.
Python
项目开发与
代码
规范
2025-05-04 19:57
shenyan~的博客
模块化是让
代码
结构清晰、易维护、可扩展的关键。哪怕是小项目,也应该有像样的模块划分,才能快速扩展新功能,不至于一团乱麻。项目unittestpytest语法风格面向类面向函数使用复杂度较繁琐更简洁插件生态基本没有...
如何用
Python
编写简单的网络爬虫(
页面
代码
简单分析过程)
2024-04-07 11:02
牛哥带你学代码的博客
由于
Python
语言有易学、丰富的库和爬虫框架、多线程支持、跨平台支持和强大的数据处理能力等特点,在编写爬虫方面具有得天独厚的优势,这些优势使得
Python
成为爬虫开发的首选语言。本文介绍了一般网络爬虫的实现过程...
python
爬虫
代码
运行之后不报错也没有结果_看完!一小时带你入门
Python
爬虫
2020-12-14 13:03
weixin_39615643的博客
一、什么叫爬虫爬虫,又名“网络爬虫”,就是能够自动
访问
互联网并将网站内容下载下来的程序。它也是搜索引擎的基础,像百度和GOOGLE都是凭借强大的网络爬虫,来检索海量的互联网信息的然后存储到云端,为网友提供...
4.1 使用
Python
获取
网页源
代码
2021-03-30 21:25
茄子爱跑步的博客
2)使用requests
获取
网页源
代码
a. GET方式 import requests
html
= requests.get('网址')#得到一个Response对象
html
_bytes =
html
.content#属性.content用来显示bytes型网页的源
代码
html
_str =
html
_bytes.dec
Python
并发 & 并行 、同步 & 异步、阻塞 & 非阻塞 以及
代码
实现
2023-09-08 17:48
Jenrey的博客
线程不安全:由于线程的执行随时会发生切换,就造成了不可预料的结果,出现线程不安全协程可以在单线程内实现并发。整体上还是单线程执行的,但是原理就是超级循环,在CPU遇到IO的时候不会等待,而是切换到下一个...
浏览器运行
python
代码
2022-05-11 09:56
m_merlon的博客
第一种是为了用
Python
来代替JavaScript,即用
Python
操作网页DOM(Document Object Model)元素,让不熟悉JS的编程人员也能用
Python
来做一个简单的动态交互网页; 第二种,比如Pyodide,它的野心很大,即将
Python
的...
python
编程
代码
看不懂怎么办
2024-07-19 19:12
2401_86114879的博客
亲爱的朋友们,今天我们要讨论,
python
代码
看不懂可以从哪些地方找答案
python
编程
代码
看不懂怎么办呀,让我们开始吧!
没有解决我的问题,
去提问
向专家提问
向AI提问
付费问答(悬赏)服务下线公告
◇ 用户帮助中心
◇ 新手如何提问
◇ 奖惩公告
问题事件
关注
码龄
粉丝数
原力等级 --
被采纳
被点赞
采纳率
系统已结题
10月30日
关注
码龄
粉丝数
原力等级 --
被采纳
被点赞
采纳率
已采纳回答
10月22日
关注
码龄
粉丝数
原力等级 --
被采纳
被点赞
采纳率
创建了问题
9月12日