mg_拉丁 2024-04-28 08:33 采纳率: 0%
浏览 16

音乐推荐系统数据集,国内的

常用的音乐推荐系统的数据集可以推荐一下吗,国内的有吗。或者有Python爬虫方法爬取数据集的可以指点一下吗?

  • 写回答

4条回答 默认 最新

  • 关注

    上午好☀️☀️☀️️
    本答案参考ChatGPT-3.5

    常用的音乐推荐系统的数据集有哪些?是否有国内的数据集?如何通过Python爬虫获取数据集?

    1. 常用的音乐推荐系统的数据集大多来自于以下几个渠道:
    • Movielens: 是一个建立于明尼苏达大学的电影评分数据集。Movielens数据集的最新版本也包括音乐部分:MusicLens。
    • Last.fm: 这是一个音乐推荐最为著名的数据集。Last.fm平台因其独特的音乐推荐系统而闻名,其数据是所有音乐推荐领域的研究人员的首选。
    • Million Song Dataset:Million Song Dataset 是一个庞大的、容纳不同音乐风格和流派的音乐的数据集,在各大音乐数据集中占有重要地位,能够让用户获得各种各样的音乐曲目。
    • Echo Nest:Echo Nest 是一个能够提供大量音乐数据的文本分析平台。一些流派、音乐家最为熟悉的数据集来源之一就是Echo Nest平台。
    1. 国内的数据集可以自己爬取,以下是简要步骤:
    • 找到数据来源网站
    • 了解网站数据爬取规则
    • 使用Python爬虫进行数据爬取(如使用BeautifulSoup或者Selenium等库)
    • 对爬取得到的数据进行处理(如使用Pandas导入数据)
    1. 代码示例:
    import requests
    from bs4 import BeautifulSoup
    import pandas as pd
    
    url = 'https://music.163.com/discover/playlist?id=3778678'
    cookies = '自己填写cookies'
    headers = {
        'User-Agent': '',
        'Cookie': cookies,
    }
    r = requests.get(url, headers=headers)
    soup = BeautifulSoup(r.content, 'html.parser')
    name = soup.find('h2', {'class': 'f-ff2 f-brk'}).string
    songs = soup.find('ul', {'class': 'f-hide'}).find_all('a')
    data = []
    for song in songs:
        song_name = song.string
        song_url = 'http://music.163.com/song/media/outer/url?id=' + song['href'].replace('/song?id=', '') + '.mp3'
        data.append([song_name, song_url])
    df = pd.DataFrame(data, columns=['song_name', 'song_url'])
    df.to_csv(name + '.csv', index=None, header=None)
    
    评论

报告相同问题?

问题事件

  • 创建了问题 4月28日

悬赏问题

  • ¥15 请把下列每一行代码完整地读懂并注释出来
  • ¥15 pycharm运行main文件,显示没有conda环境
  • ¥15 易优eyoucms关于二级栏目调用的问题
  • ¥15 寻找公式识别开发,自动识别整页文档、图像公式的软件
  • ¥15 为什么eclipse不能再下载了?
  • ¥15 编辑cmake lists 明明写了project项目名,但是还是报错怎么回事
  • ¥15 关于#计算机视觉#的问题:求一份高质量桥梁多病害数据集
  • ¥15 特定网页无法访问,已排除网页问题
  • ¥50 如何将脑的图像投影到颅骨上
  • ¥15 提问一个关于vscode相关的环境配置问题,就是输入中文但是显示不出来,代码在idea可以显示中文,但在vscode不行,不知道怎么配置环境