在使用Python爬取一个动态页面的过程中,出现了爬下来的内容相比页面内容严重缩水的问题,经高人指点,发现问题有以下几种可能:
1.原页面上有js,浏览器浏览的时候会自动执行js继续去后台取数据(通常是为了异步加载数据,提高响应速度),而你自己写的get方法只获取网页代码,并不能执行它。
2.原页面代码有加密(编码)格式,而你并没有指定格式,因此部分数据无法获取。
但可惜我本人专业知识储备不足,仍然页面编码、JS这些东西仍然是云里雾里。希望各位能帮我答疑解惑,不胜感激。
想知道什么是页面编码(数据流编码)和Python的IE控件
- 写回答
- 好问题 0 提建议
- 追加酬金
- 关注问题
- 邀请回答
-
2条回答 默认 最新
悬赏问题
- ¥15 求解O-S方程的特征值问题给出边界层布拉休斯平行流的中性曲线
- ¥15 谁有desed数据集呀
- ¥20 手写数字识别运行c仿真时,程序报错错误代码sim211-100
- ¥15 关于#hadoop#的问题
- ¥15 (标签-Python|关键词-socket)
- ¥15 keil里为什么main.c定义的函数在it.c调用不了
- ¥50 切换TabTip键盘的输入法
- ¥15 可否在不同线程中调用封装数据库操作的类
- ¥15 微带串馈天线阵列每个阵元宽度计算
- ¥15 keil的map文件中Image component sizes各项意思