Python爬虫，爬虫访问网站时遇到415. UnsupportedMediaType错误，运行结果为空

问题遇到的现象和发生背景

初学python爬虫，练习爬取1~200页文章，不知道是不是因为页面的url找错了，运行结果啥也没有。

问题相关代码，请勿粘贴截图

#导入必要模块
import requests
from bs4 import BeautifulSoup
import re

#创建idx 1~200页
for idx in range(200):
print("#"*30,idx+1)

#网站url
url = " https://www.cnblogs.com/AggSite/AggSitePostList"

#通过分析网站源码可知每页的url信息
data = {"CategoryType":"SiteHome",
        "ParentCategoryId":0,
        "CategoryId":808,
        "PageIndex":idx+1,
        "TotalPostCount":4000,
        "ItemListActionName":"AggSitePostList"}

#requests模块获取网页信息
r = requests.get(url,data=data)

#判断网页状态码
# if r.status_code != 200:
#     raise Exception()

#bs4模块创建对象
soup = BeautifulSoup(r.text,"html.parser")

#指定class获取指定信息
post_items = soup.find_all("article",class_="post-item")
for post_item in post_items:
    link = post_item.find("a",class_="post-item-title")
    print(link["href"],link.get_text())

运行结果及报错内容

我的解答思路和尝试过的方法

打印了r.text发现无法访问https://www.cnblogs.com/AggSite/AggSitePostList，访问结果时415. UnsupportedMediaType
不知道怎么找到正确的url

我想要达到的结果

爬出1-200页的文章

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
honestman_ 2022-08-22 11:57
关注
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

Python爬虫实战：基于异步IO与AI智能检测的大规模网站死链检测系统
2026-01-04 13:47

Python爬虫项目的博客在当今互联网时代，网站的稳定性和用户体验至关重要。死链（失效链接）不仅影响用户体验，还会降低搜索引擎排名，甚至导致潜在客户流失。...本文将深入探讨如何使用Python构建一个高效、智能的死链检测爬虫系统。
Python爬虫编程8——Scrapy框架
2022-03-11 13:27

彩色的泡沫的博客 Scrapy是一个为了爬取网站数据，提取结构性数据二编写的应用框架，我们只需要实现少量的代码，就能快速的进行抓取，Scrapy使用了Twisted异步网络框架，可以极大的加速我们的下载速度。 Scrapy官方文档初窥...
Python社交媒体数据备份爬虫：实现个人历史数据的高效归档
2025-09-14 21:16

Python爬虫项目的博客随着社交媒体在日常生活中的普及，个人在这些平台上积累了大量的数字足迹。本文详细介绍如何使用Python构建一个高效的社交媒体数据备份工具，能够...关键词：Python爬虫、社交媒体备份、数据归档、异步处理、API调用。
Python网络迷因(Meme)传播路径与变异过程追踪爬虫实现
2025-08-31 10:37

Python爬虫项目的博客本文基于Python网络爬虫技术，探讨了网络迷因(Meme)在社交媒体平台上的传播路径追踪与变异过程分析方法。通过设计并实现一个多平台迷因追踪爬虫系统，结合...Python爬虫；传播路径；内容变异；图像识别；社交网络分析。
【爬虫】1.1. HTTP基本原理
2023-08-25 20:06

金渐层大战哥斯拉的博客 415 Unsupported Media Type - 请求的媒体类型不被支持。 429 Too Many Requests - 客户端发送请求过于频繁，达到限制。 500 Internal Server Error - 服务器内部错误，通常因为代码错误。 502 Bad Gateway - ...
转：【Python3网络爬虫开发实战】 requests基本用法
2019-07-11 16:40

LaoYuanPython的博客运行结果如下： ['\n为什么很多人喜欢提及「拉丁语系」这个词？ \n', '\n在没有水的情况下水系宝可梦如何战斗？\n', '\n有哪些经验可以送给 Kindle 新人？\n', '\n谷歌的广告业务是如何赚钱的？\n', '\n程序员该...
路飞学城-Python 爬虫实战密训-第 1 章
2018-07-02 11:50

idoublexi的博客一、requests模块http://www.cnblogs.com/wupeiqi/articles/6283017.htmlhttps://www.cnblogs.com/lei0213/p/6957508.htmlPython标准库中提供了：...它是为另一个时代、另一个互联网所创建的。它需要巨量的工作...
Python3网络爬虫实战-24、requests：基本使用
2019-07-30 14:59

追梦IT男的博客由于图片是二进制数据，所以前者在打印时转化为 str 类型，也就是图片直接转化为字符串，理所当然会出现乱码。两个属性有什么区别？前者返回的是字符串类型，如果返回结果是文本文件，那么用这种方式直接获取其...
【Python3网络爬虫开发实战】 3.2.1-基本用法
2019-07-04 10:24

华为云开发者联盟的博客但需要注意的书，如果返回结果不是JSON格式，便会出现解析错误，抛出json.decoder.JSONDecodeError异常。抓取网页上面的请求链接返回的是JSON形式的字符串，那么如果请求普通的网页，则肯定能获得相应的内容...
爬虫数据采集基础
2022-06-28 23:20

m0_46427459的博客 500 服务器内部错误服务器遇到错误，无法完成请求 501 未实现服务器不具备完成请求的功能 502 错误网关服务器作为网关或代理，从上游服务器收到无效响应 503 服务不可用服务器目前无法使用 504 网关超时服务器...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 8月30日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 8月22日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 8月22日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月22日