m0_43450539 2021-04-17 23:05 采纳率: 50%
浏览 379
已采纳

Requests 返回结果的目标内容是js

小白尝试使用requests获取网易云音乐ID的时候发现问题,网址如下。

https://music.163.com/#/discover/toplist

在网站上看出id就在a标签的href属性里,浏览器中显示的是当前音乐的id,如下图。

但是问题出现了,在pyc中调用requests.get获取网页html。在html中寻找需要的音乐id

得到的html里音乐ID是${song.id}

请问是什么情况?

代码就以下四行

import requests
url = "https://music.163.com/#/discover/toplist"
res = requests.get(url)
print(res.text)
  • 写回答

6条回答 默认 最新

  • 浴火_凤凰 2021-04-18 02:07
    关注

    你的截图的结果是JS代码执行之后的结果,那个只做参考 不能作为爬虫的结果

    爬虫requests获取的结果是你右键-查看网页源代码 里面看到的内容 也 是没有执行JS的结果

    如果你想获取那个数据,2个方法:

    1.使用selenium等可以操作浏览器的类库 打开浏览器去抓取

    2.自己分析你需要的数据是在哪个JS文件中,然后使用requests爬取那个JS文件获取你要的数据

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(5条)

报告相同问题?

悬赏问题

  • ¥15 微信会员卡接入微信支付商户号收款
  • ¥15 如何获取烟草零售终端数据
  • ¥15 数学建模招标中位数问题
  • ¥15 phython路径名过长报错 不知道什么问题
  • ¥15 深度学习中模型转换该怎么实现
  • ¥15 HLs设计手写数字识别程序编译通不过
  • ¥15 Stata外部命令安装问题求帮助!
  • ¥15 从键盘随机输入A-H中的一串字符串,用七段数码管方法进行绘制。提交代码及运行截图。
  • ¥15 TYPCE母转母,插入认方向
  • ¥15 如何用python向钉钉机器人发送可以放大的图片?