m0_43450539 2021-04-17 23:05 采纳率: 50%
浏览 385
已采纳

Requests 返回结果的目标内容是js

小白尝试使用requests获取网易云音乐ID的时候发现问题,网址如下。

https://music.163.com/#/discover/toplist

在网站上看出id就在a标签的href属性里,浏览器中显示的是当前音乐的id,如下图。

但是问题出现了,在pyc中调用requests.get获取网页html。在html中寻找需要的音乐id

得到的html里音乐ID是${song.id}

请问是什么情况?

代码就以下四行

import requests
url = "https://music.163.com/#/discover/toplist"
res = requests.get(url)
print(res.text)
  • 写回答

6条回答 默认 最新

  • 浴火_凤凰 2021-04-18 02:07
    关注

    你的截图的结果是JS代码执行之后的结果,那个只做参考 不能作为爬虫的结果

    爬虫requests获取的结果是你右键-查看网页源代码 里面看到的内容 也 是没有执行JS的结果

    如果你想获取那个数据,2个方法:

    1.使用selenium等可以操作浏览器的类库 打开浏览器去抓取

    2.自己分析你需要的数据是在哪个JS文件中,然后使用requests爬取那个JS文件获取你要的数据

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(5条)

报告相同问题?

悬赏问题

  • ¥15 有没有整苹果智能分拣线上图像数据
  • ¥20 有没有人会这个东西的
  • ¥15 cfx考虑调整“enforce system memory limit”参数的设置
  • ¥30 航迹分离,航迹增强,误差分析
  • ¥15 Chrome Manifest扩展引用Ajax-hook库拦截请求失败
  • ¥15 用Ros中的Topic通讯方式控制小乌龟的速度,走矩形;编写订阅器代码
  • ¥15 LLM accuracy检测
  • ¥15 pycharm添加远程解释器报错
  • ¥15 如何让子窗口鼠标滚动独立,不要传递消息给主窗口
  • ¥15 如何能达到用ping0.cc检测成这样?如图