python爬取云音乐列表却解析不出数据

最近跟着网上教程初学着用python爬取页面，于是就想试着扒一扒自己网易云音乐歌单的歌曲，想把歌单里歌曲的链接曲名这些全部爬出来
def getPage():
url = 'http://music.163.com/#/m/playlist?id=75411989'
r = requests.get(url)
page = r.text
print page
pattern = re.compile(r'Jackrabbit
items = re.findall(pattern,page)
print items
for item in items:
print item
但是解析网页后发现根本解析不出歌曲id或名称，原因是否是我正则表达式不对呢？

然后借用网上找到的匹配链接的正则
pattern2 = re.compile(r"(?<=href=\").+?(?=\")|(?<=href=\').+?(?=\')")
得到了这样的结果
/song?id=${x.id}
javascript:;
/album?id=${x.album.id}
javascript:;
/album?id=${x.album.id}
/song?id=${x.id}
javascript:;

想问一下前辈们这个无法解析的原因，另外能否用beafulsoup得到结果呢？（歌曲信息链接似乎在非常子层的div中，感觉用bs4很复杂啊）

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
devmiao 2016-09-03 16:29
关注
http://www.zhihu.com/question/41505181?sort=created

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python 爬取表格获取不到数据 python
2020-02-17 22:52

回答 4 已采纳爬取需要在请求头里面添加Host，要不然爬取不到任何信息，另外源码是不规则的html代码，所以需要指定html解析器 ``` # -*- coding：utf-8 -*- import os
python爬取数据结果是一个空列表 python 爬虫
2022-11-23 10:22

回答 4 已采纳 import requests from lxml import etree url = 'https://nba.hupu.com/stats/players' headers = {'User
python 爬虫，如何爬取相关数据 python 有问必答爬虫
2021-11-11 11:15

回答 1 已采纳先确定需要爬取的网站，然后分析网站的数据来源，是后端生成数据还是ajax生成数据，确定数据来源方式就根据HTTP请求编写代码，这个涉及一些请求参数的加密、转换等等处理，然后清洗数据和数据入库
python爬取网易云_利用python爬取网易云音乐，并把数据存入mysql
2020-11-29 21:14

weixin_39607837的博客作者：sergiojune Python爱好者社区--专栏作者个人公众号：日常学python专注python爬虫，数据可视化，数据分析，python前端技术公众号：Python爱好者社区获取本文代码方式：关注Python爱好者社区，回复网易云在简单...
python爬取音乐 python
2023-01-11 17:11

回答 2 已采纳可以先从post data中查看url请求时提交的参数，根据参数名在js源码中检索，大致梳理一下代码执行的流程，在可疑处附近打上断点
python爬取数据遇到的一些问题 python
2021-11-24 07:07

回答 5 已采纳 import requests url = r'https://hugovk.github.io/top-pypi-packages/top-pypi-packages-30-days.min.js
python 爬取数据数据缺失 python
2022-11-25 20:06

回答 2 已采纳它这个做了一点点反扒，你需要把标签里面的5取出来，和你的0.9拼在一起。试试下面这个看行不 Moive_score1 = li.xpath('./i/b/text()') Moive_score2 =
python爬取新闻数据
2022-03-22 14:49

qq_57344778的博客最近想获取一些新闻数据来做一个NLP的分类模型所以爬取了新浪的一些新闻数据用于学习使用。首先先查看网页源码：发现url中id和类别中的s_id相等，经过尝试替换，发现该编号确实是类别所在标签。有发现page...
python 爬虫爬取网易云音乐 python
2019-04-17 19:04

回答 2 已采纳搜索“防盗链” 把request headers信息完善一下越完整，就越像真的浏览器请求
如何使用python爬取canvas中的内容呢？ css javascript python
2022-04-29 10:30

回答 1 已采纳需要在浏览器上临时显示后端实时处理的图像，需要将图像数据转成json字符串传输给js绘图。后端python处理： import cv2 as cvfrom encodings import base
python爬虫爬取jsonp请求的响应数据怎么获取 json python
2021-05-22 21:34

回答 1 已采纳这里我们以爬取淘宝评论为例子讲解一下如何去做到的。这里主要分为了四步：一获取淘宝评论时，ajax请求链接（url）二获取该ajax请求返回的json数据三使用python解析js
python爬取，响应状态正确，但是解析不出内容
2018-12-15 18:33

听风llo的博客爬取的是58同城租房信息，执行程序后，只是光标在闪烁，长时间不显示结果。由于状态码为200，所以考虑正则表达式是否合理。由于网页源代码中有大量的换行符，一开始匹配用的是[\s\S]*?，并没有考虑所要获取的内容...
为什么python爬取下来的json格式的数据解析后不能用列表推导式输出数据? python 有问必答
2021-06-10 15:32

回答 3 已采纳 title = [i['title'] for i in data['data']['list']]
python爬取网页数据 ajax_【Python爬虫学习笔记12】Ajax数据爬取简介
2020-11-29 14:05

weixin_39981632的博客有时候在我们设计利用requests抓取网页数据的时候，会发现所获得的结果可能与浏览器显示给我们的不一样：比如说有的信息我们通过浏览器可以显示，但一旦用requests却得不到想要的结果。这种现象是因为我们通过...
python爬取天气数据_Python爬取天气情况
2020-11-28 13:28

weixin_39844481的博客设计方案爬虫名称：爬取天气情况并进行可视化爬虫内容：爬取2020年3月份莆田市天气情况爬虫设计：目标url，获取网页源代码，数据提取，数据保存二.页面的结构特征分析（网址：...
没有解决我的问题, 去提问

悬赏问题

¥100 Jenkins自动化部署—悬赏100元
¥15 关于#python#的问题：求帮写python代码
¥20 MATLAB画图图形出现上下震荡的线条
¥15 关于#windows#的问题：怎么用WIN 11系统的电脑克隆WIN NT3.51-4.0系统的硬盘
¥15 perl MISA分析p3_in脚本出错
¥15 k8s部署jupyterlab，jupyterlab保存不了文件
¥15 ubuntu虚拟机打包apk错误
¥199 rust编程架构设计的方案有偿
¥15 回答4f系统的像差计算
¥15 java如何提取出pdf里的文字？