怎么爬取b站番剧的真实评分

如何使用python爬取b站番剧真实评分，22年当时看过网友用爬虫统计出三体的真实评分，现在好像b站更新了新的反爬，这个代码用不了了

import requests
import json

print(&quot;----------------------------------------------------------------------------------&quot;)
print(&quot;三体动画B站评分&quot;)

counts = [0, 0, 0, 0, 0]

longs = 0
longt = 0
cursor = 0

while True:
    res = requests.get(&quot;https://api.bilibili.com/pgc/review/long/list?media_id=4315402&amp;ps=20&amp;sort=0&amp;cursor={}&quot;.format(cursor))
    data = json.loads(res.text)
    for i in data[&quot;data&quot;][&quot;list&quot;]:
        longs += i[&quot;score&quot;]//2
        longt += 5
        counts[i[&quot;score&quot;]//2-1] += 1

    if data[&quot;data&quot;][&quot;next&quot;] != 0:
        cursor = int(data[&quot;data&quot;][&quot;next&quot;])
    else:
        break

print(&quot;长评总星数：{}，总长评数{}，长评平均：{:.1f}&quot;.format(longs, longt//5, longs / longt * 10))

shorts = 0
shortt = 0
cursor = 0

while True:
    res = requests.get(&quot;https://api.bilibili.com/pgc/review/short/list?media_id=4315402&amp;ps=20&amp;sort=0&amp;cursor={}&quot;.format(cursor))
    data = json.loads(res.text)
    for i in data[&quot;data&quot;][&quot;list&quot;]:
        shorts += i[&quot;score&quot;]//2
        shortt += 5
        counts[i[&quot;score&quot;]//2-1] += 1

    if data[&quot;data&quot;][&quot;next&quot;] != 0:
        cursor = int(data[&quot;data&quot;][&quot;next&quot;])
    else:
        break

print(&quot;短评总星数：{}，总短评数{}，短评平均：{:.1f}&quot;.format(shorts, shortt//5, shorts / shortt * 10))
print(&quot;总星数：{}，平均：{:.1f}&quot;.format(shorts + longs , (shorts+longs) / (shortt+longt) * 10))
for i in range(1,6):
    print(&quot;{}星人数{}，占比{:.2f}%&quot;.format(i, counts[i-1], counts[i-1]/(longt+shortt)*500))

print(&quot;----------------------------------------------------------------------------------&quot;)

现在好像不行了，想问有没有其他办法，更新下这个代码，我想爬取一下mujica的真实评分

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

5条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
阿里嘎多学长 2025-03-08 15:18
关注
阿里嘎多学长整理AIGC生成，因移动端显示问题导致当前答案未能完全显示，请使用PC端查看更加详细的解答过程

爬取 Bilibili 番剧真实评分

Bilibili 的反爬虫机制确实会使得之前的爬虫代码无法工作。为了爬取番剧的真实评分，我们需要使用更加智能的爬虫技术和策略。

以下是一个使用 Python 和 Scrapy 框架爬取 Bilibili 番剧真实评分的示例代码：

import scrapy import json class BilibiliSpider(scrapy.Spider): name = "bilibili_spider" start_urls = [ 'https://api.bilibili.com/x/web-interface/view', # 番剧详情页 ] def parse(self, response): video_id = response.url.split('/')[-1] url = f'https://api.bilibili.com/x/web-interface/stat?aid={video_id}' yield scrapy.Request(url, callback=self.parse_stat) def parse_stat(self, response): data = json.loads(response.body.decode('utf-8')) if data['code'] == 0: stat = data['data']['stat'] print(f'Video {video_id} has {stat["like"] + stat["dislike"]} ratings') else: print(f'Failed to get ratings for video {video_id}')

这个爬虫使用 Scrapy 框架发送请求到 Bilibili 的 API，获取番剧的详情页和统计信息。然后，它将解析 JSON 数据，提取番剧的评分信息。

请注意，这只是一个示例代码，实际上你可能需要使用更加复杂的策略和技术来爬取 Bilibili 的评分信息，例如使用代理、模拟浏览器行为、处理反爬虫机制等。

另外，Bilibili 的 API 使用限制和反爬虫机制可能会使得爬虫代码无法工作，请确保你遵守 Bilibili 的使用条款和政策。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

[爬虫] B站番剧信息爬取
2019-08-04 22:20

Makesths的博客本次爬取目标是： bilibili的免费视频及其信息（包括点赞、收藏、硬币、评论等），用于后期做数据分析，之后此文将不定时更新爬虫实现前提条件语言： Python 3 框架： Scrapy 1.6.0 编译器： Pycharm 平台： ...
B站游戏排行榜（No.1竟是‘原神‘）—— B站动态页面爬取
2022-01-20 19:24

雾里看花花里看雾的博客需求：爬取b站游戏榜中热度榜的游戏名称、游戏描述、发行公司、游戏分类。链接：https://game.bilibili.com/platform/ranks。代码： import requests as req import json import csv import traceback import ...
B站视频和用户互动：视频热榜、评论研究
2024-07-04 15:53

Coinisi..的博客通过编程自动化，我们从B站的多个数据源中收集了广泛的信息，具体包括：视频热榜信息：涵盖视频标题、UP主信息、发布时间、观看次数、点赞数、收藏数和评论数。这些数据用于分析视频流行度的影响因素及其变化趋势。...
基于python对动漫数据爬取与分析论文
2024-05-30 10:09

qq_1076315463的博客系统的后端数据处理采用Python语言+Django框架，Django框架是一款由中国程序员开发的Web编程框架，此框架非常适合开发各种使用Django构建的Web应用。因其具有独特的基于组件的框架结构和设计精细的缓存支持，它...
8亿参数Seed-Coder开启智能编程新纪元
2025-12-16 12:16

聚合收藏的博客字节跳动推出的开源代码模型Seed-Coder，凭借8亿参数和创新的“模型中心”数据处理范式，在代码生成、...支持32K上下文长度，适用于自动编程、代码审查与教育场景，展现出超越同规模模型的性能，推动AI编程生态发展。
AutoGPT能否编写Python脚本？编程能力全面评测
2025-12-15 07:40

新职语的博客比如，当你提出：“爬取豆瓣电影Top250的片名和评分，并导出为CSV。” 传统AI助手可能会给你一段静态代码，然后说“你可以试试这个”。而AutoGPT的做法是： - 先搜索豆瓣页面结构； - 决定使用requests + ...
全球大模型真实编程能力大摸底！评测新标准揭秘模型能力虚胖真相
2025-07-28 11:37

AGI-Eval大模型评测的博客基于此数据集，我们对全球 18 个主流大模型的算法编程能力进行了系统评测并量化得分，详细评分榜单如下所示，可以看到全球顶尖大模型距离以往所宣称的编程能力还存在很大差距，哪怕是最高分的 o4-mini-high 也仅仅...
AIGC领域AI编程：从入门到精通之路
2025-05-10 23:07

SuperAGI架构师的AI实验室的博客今天，AIGC（比如ChatGPT、GitHub Copilot）正在成为开发者的“超级编程搭子”——它能写代码、改bug、写文档，甚至能根据你的需求生成“会说话的代码”（带注释、测试用例、流程图）。本文的目的就是教你：如何让AI...
LLM综述笔记2：大语言模型的资源
2025-07-29 10:54

wimmmer的博客本文总结了当前可公开获取的大语言模型(LLM)开发资源，包括模型权重、API接口、预训练语料和工具库。重点介绍了LLaMA、Mistral、Gemma、Qwen等主流开源模型的特点和性能，以及OpenAI的API接口。在预训练语料方面，...
Python跨境电商数据爬取实战：Scrapy+Playwright+AI对抗反爬
2025-04-01 23:58

Python爬虫项目的博客文章包含完整的项目架构设计、核心代码实现以及大规模分布式部署方案，帮助读者掌握电商数据爬取的全套技术栈。多平台适配能力：通过解析路由器实现一套代码支持多个平台智能反反爬体系：综合运用行为模拟、指纹伪装...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月8日

怎么爬取b站番剧的真实评分

5条回答 默认 最新

爬取 Bilibili 番剧真实评分

问题事件

5条回答默认最新