在使用Python爬取一个动态页面的过程中,出现了爬下来的内容相比页面内容严重缩水的问题,经高人指点,发现问题有以下几种可能:
1.原页面上有js,浏览器浏览的时候会自动执行js继续去后台取数据(通常是为了异步加载数据,提高响应速度),而你自己写的get方法只获取网页代码,并不能执行它。
2.原页面代码有加密(编码)格式,而你并没有指定格式,因此部分数据无法获取。
但可惜我本人专业知识储备不足,仍然页面编码、JS这些东西仍然是云里雾里。希望各位能帮我答疑解惑,不胜感激。
想知道什么是页面编码(数据流编码)和Python的IE控件
- 写回答
- 好问题 0 提建议
- 追加酬金
- 关注问题
- 邀请回答
-
2条回答 默认 最新
悬赏问题
- ¥15 做个有关计算的小程序
- ¥15 MPI读取tif文件无法正常给各进程分配路径
- ¥15 如何用MATLAB实现以下三个公式(有相互嵌套)
- ¥30 关于#算法#的问题:运用EViews第九版本进行一系列计量经济学的时间数列数据回归分析预测问题 求各位帮我解答一下
- ¥15 setInterval 页面闪烁,怎么解决
- ¥15 如何让企业微信机器人实现消息汇总整合
- ¥50 关于#ui#的问题:做yolov8的ui界面出现的问题
- ¥15 如何用Python爬取各高校教师公开的教育和工作经历
- ¥15 TLE9879QXA40 电机驱动
- ¥20 对于工程问题的非线性数学模型进行线性化