Python爬虫，爬虫访问网站时遇到415. UnsupportedMediaType错误，运行结果为空

问题遇到的现象和发生背景

初学python爬虫，练习爬取1~200页文章，不知道是不是因为页面的url找错了，运行结果啥也没有。

问题相关代码，请勿粘贴截图

#导入必要模块
import requests
from bs4 import BeautifulSoup
import re

#创建idx 1~200页
for idx in range(200):
print("#"*30,idx+1)

#网站url
url = " https://www.cnblogs.com/AggSite/AggSitePostList"

#通过分析网站源码可知每页的url信息
data = {"CategoryType":"SiteHome",
        "ParentCategoryId":0,
        "CategoryId":808,
        "PageIndex":idx+1,
        "TotalPostCount":4000,
        "ItemListActionName":"AggSitePostList"}

#requests模块获取网页信息
r = requests.get(url,data=data)

#判断网页状态码
# if r.status_code != 200:
#     raise Exception()

#bs4模块创建对象
soup = BeautifulSoup(r.text,"html.parser")

#指定class获取指定信息
post_items = soup.find_all("article",class_="post-item")
for post_item in post_items:
    link = post_item.find("a",class_="post-item-title")
    print(link["href"],link.get_text())

运行结果及报错内容

我的解答思路和尝试过的方法

打印了r.text发现无法访问https://www.cnblogs.com/AggSite/AggSitePostList，访问结果时415. UnsupportedMediaType
不知道怎么找到正确的url

我想要达到的结果

爬出1-200页的文章

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
honestman_ 2022-08-22 11:57
关注
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

Python爬虫，爬虫访问网站时遇到415. UnsupportedMediaType错误，运行结果为空 python 爬虫
2022-08-22 11:35

回答 3 已采纳
Python爬虫时遇到问题： json.decoder.JSONDecodeError: Expecting value: line 1 column 1 (char 0) json python 爬虫
2022-07-23 12:09

回答 3 已采纳
python爬虫request后返回值为空 chrome python 有问必答爬虫
2022-01-27 16:25

回答 2 已采纳接口需要post请求并发送数据，题主get请求没用改下面就可以了，注意不能采集太快，有防火墙会拦截。。-_-||。。。 import requests import time headers =
Python爬虫编程8——Scrapy框架
2022-03-11 13:27

彩色的泡沫的博客 Scrapy是一个为了爬取网站数据，提取结构性数据二编写的应用框架，我们只需要实现少量的代码，就能快速的进行抓取，Scrapy使用了Twisted异步网络框架，可以极大的加速我们的下载速度。 Scrapy官方文档初窥...
python爬虫使用json()方法将response结果转化为JSON格式时报错 json python 爬虫
2022-02-11 13:01

回答 4 已采纳网站设计了相应的反扒策略，需要把Cookie添加到headers中，这种问题一般从headers入手，有的限制User-Agent必须有，有的限制Cookie headers = { 'Cooki
写完python爬虫后运行不出结果 python 有问必答爬虫
2022-02-15 05:15

回答 3 已采纳数据是动态从接口获取的，在网页中没有办法直接获取，除非用 selenium模块结合浏览器爬取动态数据 # -*- coding:utf-8 -*- import pandas as pd impor
python爬虫关于xpath提取出来为空列表的问题 python 有问必答爬虫
2021-09-30 17:40

回答 2 已采纳你检查下这个网页中的内容是不是通过js代码读取外部json数据来动态更新的。requests只能获取网页的静态源代码，动态更新的内容取不到。对于动态更新的内容要用selenium 来爬取。或者是通
转：【Python3网络爬虫开发实战】 requests基本用法
2019-07-11 16:40

LaoYuanPython的博客运行结果如下： ['\n为什么很多人喜欢提及「拉丁语系」这个词？ \n', '\n在没有水的情况下水系宝可梦如何战斗？\n', '\n有哪些经验可以送给 Kindle 新人？\n', '\n谷歌的广告业务是如何赚钱的？\n', '\n程序员该...
python爬虫xpath解析返回为空有什么解决方法吗 python 爬虫
2021-12-10 11:12

回答 1 已采纳为空的地方xpath主要是为了拿到什么数据，贴一下网页和要拿到的数据，帮你写一下xpath。上面图上的xpath那么长那么绝对路径，大概率拿不到数据的。
Python爬虫 xpath 列表为空 python 有问必答爬虫
2022-03-08 08:32

回答 2 已采纳第二个li的div下少了结束标签导致etree解析出错了少了div结束标签后，etree将建筑类别后的几点全部归类到第二li下了，改下面这样就可以了 import requests from lxm
python爬虫运行无结果 python 爬虫
2021-10-13 19:02

回答 1 已采纳你这个目前只写了一个类，并没有调用，肯定是没有结果的
【爬虫】1.1. HTTP基本原理
2023-08-25 20:06

金渐层大战哥斯拉的博客 415 Unsupported Media Type - 请求的媒体类型不被支持。 429 Too Many Requests - 客户端发送请求过于频繁，达到限制。 500 Internal Server Error - 服务器内部错误，通常因为代码错误。 502 Bad Gateway - ...
python 爬虫使用代理 ip 访问网站遇到的问题 python
2021-03-28 15:50

回答 2 已采纳把https://去掉试一下看： PROXY = "111...：4221" chrome_opt = WebDriver.ChromeOptions() chrome_opt.add_argume
Python3网络爬虫实战-24、requests：基本使用
2019-07-30 14:59

追梦IT男的博客由于图片是二进制数据，所以前者在打印时转化为 str 类型，也就是图片直接转化为字符串，理所当然会出现乱码。两个属性有什么区别？前者返回的是字符串类型，如果返回结果是文本文件，那么用这种方式直接获取其...
【Python3网络爬虫开发实战】 3.2.1-基本用法
2019-07-04 10:24

华为云开发者联盟的博客但需要注意的书，如果返回结果不是JSON格式，便会出现解析错误，抛出json.decoder.JSONDecodeError异常。抓取网页上面的请求链接返回的是JSON形式的字符串，那么如果请求普通的网页，则肯定能获得相应的内容...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 8月30日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 8月22日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 8月22日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月22日

悬赏问题

¥15 Centos7 / PETGEM
¥15 csmar数据进行spss描述性统计分析
¥15 各位请问平行检验趋势图这样要怎么调整？说标准差差异太大了
¥15 delphi webbrowser组件网页下拉菜单自动选择问题
¥15 wpf界面一直接收PLC给过来的信号，导致UI界面操作起来会卡顿
¥15 init i2c:2 freq:100000[MAIXPY]: find ov2640[MAIXPY]: find ov sensor是main文件哪里有问题吗
¥15 运动想象脑电信号数据集.vhdr
¥15 三因素重复测量数据R语句编写，不存在交互作用
¥15 微信会员卡等级和折扣规则
¥15 微信公众平台自制会员卡可以通过收款码收款码收款进行自动积分吗