畅情 2021-08-14 11:26 采纳率: 60%

浏览 53

已结题

想请教一些练习爬虫时候遇到的问题

练习爬虫时，爬取今日头条网页代码的时候发现网页的内容集在doc，看到一些以前的回答，他们需要的网页信息都是集中在xhr，以及这个sourcemapping里面的内容通过requests请求是的不到的，这是什么原因

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN专家-showbo 2021-08-14 11:48
关注
requests.get得到的是和浏览查看源代码一样的内容，js动态生成的内容requests.get无法获取，需要用Selenium来解析才行。

要么就找到数据接口直接reqeusts.get接口获取数据，头条搜索结果内容是在页面里面的用beautifulsoup解析下就行了。有帮助或启发麻烦点个采纳【本回答右上角】，谢谢~~有其他问题可以继续交流~

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 8月22日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 8月14日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月14日

悬赏问题

¥50 mac mini外接显示器画质字体模糊
¥15 TLS1.2协议通信解密
¥40 图书信息管理系统程序编写
¥20 Qcustomplot缩小曲线形状问题
¥15 企业资源规划ERP沙盘模拟
¥15 树莓派控制机械臂传输命令报错，显示摄像头不存在
¥15 前端echarts坐标轴问题
¥15 ad5933的I2C
¥15 请问RTX4060的笔记本电脑可以训练yolov5模型吗？
¥15 数学建模求思路及代码