在使用Python爬取一个动态页面的过程中,出现了爬下来的内容相比页面内容严重缩水的问题,经高人指点,发现问题有以下几种可能:
1.原页面上有js,浏览器浏览的时候会自动执行js继续去后台取数据(通常是为了异步加载数据,提高响应速度),而你自己写的get方法只获取网页代码,并不能执行它。
2.原页面代码有加密(编码)格式,而你并没有指定格式,因此部分数据无法获取。
但可惜我本人专业知识储备不足,仍然页面编码、JS这些东西仍然是云里雾里。希望各位能帮我答疑解惑,不胜感激。
想知道什么是页面编码(数据流编码)和Python的IE控件
- 写回答
- 好问题 0 提建议
- 追加酬金
- 关注问题
- 邀请回答
-
2条回答 默认 最新
悬赏问题
- ¥15 关于#matlab#的问题:在模糊控制器中选出线路信息,在simulink中根据线路信息生成速度时间目标曲线(初速度为20m/s,15秒后减为0的速度时间图像)我想问线路信息是什么
- ¥15 banner广告展示设置多少时间不怎么会消耗用户价值
- ¥16 mybatis的代理对象无法通过@Autowired装填
- ¥15 可见光定位matlab仿真
- ¥15 arduino 四自由度机械臂
- ¥15 wordpress 产品图片 GIF 没法显示
- ¥15 求三国群英传pl国战时间的修改方法
- ¥15 matlab代码代写,需写出详细代码,代价私
- ¥15 ROS系统搭建请教(跨境电商用途)
- ¥15 AIC3204的示例代码有吗,想用AIC3204测量血氧,找不到相关的代码。