爬虫KS实战中，最后一行代码K.parms_start_url()要求定义self, 与视频不一样

问题遇到的现象和发生背景

由于最后一行代码一直要求申明 self，所以代码改为了K.parms_start_url(self= K)
这一问题解决后运行又发现报错
（K这个object并没有start_url的参数）
原文：
AttributeError: type object 'KSchengdu_event' has no attribute 'start_url'

问题相关代码，请勿粘贴截图

    for page in range(3): # 模拟翻页场景，使用for循环
            response = requests.post(self.start_url, headers=self.headers, json=self.data)

运行结果及报错内容

Traceback (most recent call last):
  File "C:\Users\surface\PycharmProjects\爬虫程序\post实战，采集快手热门视频.py", line 60, in <module>
    k.parms_start_url(self=k)
  File "C:\Users\surface\PycharmProjects\爬虫程序\post实战，采集快手热门视频.py", line 28, in parms_start_url
    response = requests.post(self.start_url, headers=self.headers, json=self.data)
AttributeError: type object 'KSchengdu_event' has no attribute 'start_url'

我的解答思路和尝试过的方法

我尝试过将 init中self的参数删除移植到 parms_start_url中直接定义，但是报错

我全部代码：

import requests
import os # 创建对应的保存文件夹


class KSchengdu_event(object):
    os_path = os.getcwd() + '/成都活动视频/' #创建文件夹路径
    if not os.path.exists(os_path):
        os.mkdir(os_path)




    def __init__(self):
        self.start_url = 'https://www.kuaishou.com/graphql'
        self.headers = {
            'content - type': 'application / json',
            'Cookie': 'kpf=PC_WEB; kpn=KUAISHOU_VISION; clientid=3; did=web_e6ce240f9ecffb9dc0cc2d826821e185; client_key=65890b29; userId=2759025539; kuaishou.server.web_st=ChZrdWFpc2hvdS5zZXJ2ZXIud2ViLnN0EqABe0zRDaO8HRKHXIbzw_P8Exx_YU0eZlfbGRGBS4X4pNpZ4xrdcfTHsJTuF-7_tXotCED7iBV4PuxWQxLtHciHQoPOIbJrFwQQYSyqnpbZmjyTlwoIOggQuut-iTagJB7ct4N5K1MxU9SfXoaOzOo4i-6zY3HB0Fj1eLv3agyYheN3LKcLGzJncYDrcUwump29samxzJfTuuD1qRqzuKRGwRoS-1Rj5-IBBNoxoIePYcxZFs4oIiDrpN2yGP1gXQvUJTQ-bFSIAdBNCsRqskqFDVw2LI50tSgFMAE; kuaishou.server.web_ph=4dcd55ac36f14b144915a410d1b3b4e7b559',
            'Host': 'www.kuaishou.com',
            'Origin': 'https: // www.kuaishou.com',
            'Referer': 'https://www.kuaishou.com/search/video?searchKey=%E6%88%90%E9%83%BD%E6%B4%BB%E5%8A%A8',
            'User - Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/98.0.4758.102 Safari/537.36'
        }
        self.data = {"operationName":"visionSearchPhoto","variables":{"keyword":"成都活动","pcursor":"1","page":"search","searchSessionId":"MTRfMjc1OTAyNTUzOV8xNjQ1Mzc1NzI1MTUwX-aIkOmDvea0u-WKqF82MDU4"},"query":"query visionSearchPhoto($keyword: String, $pcursor: String, $searchSessionId: String, $page: String, $webPageArea: String) {\n  visionSearchPhoto(keyword: $keyword, pcursor: $pcursor, searchSessionId: $searchSessionId, page: $page, webPageArea: $webPageArea) {\n    result\n    llsid\n    webPageArea\n    feeds {\n      type\n      author {\n        id\n        name\n        following\n        headerUrl\n        headerUrls {\n          cdn\n          url\n          __typename\n        }\n        __typename\n      }\n      tags {\n        type\n        name\n        __typename\n      }\n      photo {\n        id\n        duration\n        caption\n        likeCount\n        realLikeCount\n        coverUrl\n        photoUrl\n        liked\n        timestamp\n        expTag\n        coverUrls {\n          cdn\n          url\n          __typename\n        }\n        photoUrls {\n          cdn\n          url\n          __typename\n        }\n        animatedCoverUrl\n        stereoType\n        videoRatio\n        __typename\n      }\n      canAddComment\n      currentPcursor\n      llsid\n      status\n      __typename\n    }\n    searchSessionId\n    pcursor\n    aladdinBanner {\n      imgUrl\n      link\n      __typename\n    }\n    __typename\n  }\n}\n"}


    def parms_start_url(self):

        for page in range(3): # 模拟翻页场景，使用for循环
            response = requests.post(self.start_url, headers=self.headers, json=self.data)
            # 将同类方法中数据传输需要加上self.
            self.parms_response_data(response)

    def parms_response_data(self, response):
        # 将数据改为json模式
        json_data = response.json()
        # 数据提取
        data_list = json_data['data']['visionSearchPhoto']['feeds']
        # for 循环遍历大列表
        for data_dict in data_list:
            # 处理按照喜欢收集数据
            likes = int(data_dict['photo']['realLikeCount'])
            if likes > 10000:

                title = data_dict['photo']['caption']
                # 获取视频链接
                video = data_dict['photo']['photoUrl']
                # 发送请求，获取视频的字节流数据
                data = requests.get(video).content

                self.parms_save_data(title, data)


    def parms_save_data(self, title, data):
        with open(self.os_path + title + '.mp4' + 'wb') as f:
            f.write(data)
        print(f"{title}---------采集OK")


if __name__ == '__main__':
    k = KSchengdu_event
    k.parms_start_url(self=k)

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
技术专家团-Plio大咸鱼 2022-02-21 08:31
关注
将类实例化的时候,类名后面要带括号
形如

if __name__ == '__main__': k = KSchengdu_event() k.parms_start_url()

self是类方法被调用时自动传入的隐藏参数,不需要你自己写.
有帮助望采纳~
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

Python爬虫学习笔记_DAY_26_Python爬虫之requests库的安装与基本使用【Python爬虫】
2022-02-15 22:36

跳探戈的小龙虾的博客 p.s.高产量博主，点个关注????不迷路！目录 ...I.requests库的介绍与安装 ...它是一个Python第三方库，处理URL资源特别方便，可以完全取代之前学习的urllib库，并且更加精简代码量(相较于urllib库)。那么话不多说
labels用python 怎么用_Python multiclass.unique_labels方法代码示例
2020-12-21 06:25

weixin_39702480的博客本文整理汇总了Python中sklearn.utils.multiclass.unique_labels方法的典型用法代码示例。如果您正苦于以下问题：Python multiclass.unique_labels方法的具体用法？Python multiclass.unique_labels怎么用？Python ...
Python_爬虫数据存入数据库(超详细过程
2022-06-17 22:48

小枫Geek的博客目录一、新建项目二、程序的编写三、数据的爬取1.在cmd窗口输入scrapy startproject [项目名称] 创建爬虫项目接着创建爬虫文件，scrapy genspider [爬虫名字] [爬虫域名]打开pycharm项目，就可以看到生成的cblog.py...
python __init__()构造器中的super()使用用法
2019-03-03 12:22

caixxiong的博客用super写构造器 &nbsp; &nbsp; 用super来调用__init__的方式,设计得当的话,可以使得每个类的__init__恰好被调用一... 在定义自己的__init__()时,参数列表是(self, parms, **kargs),其中parms是自身...
python爬虫第十七课-使用Python访问MySql数据库(2).docx
2021-12-16 14:10

本课程主要分为三个部分：使用Python访问MySQL数据库的基本步骤、具体代码实现以及一个项目实践案例——构建一个学生管理系统。 ### 一、使用Python访问MySQL数据库 #### 1. 安装 pymysql 首先需要安装`pymysql`库...
python iteritems函数_Python six.iteritems方法代码示例
2020-12-20 17:47

weixin_39569051的博客本文整理汇总了Python中sklearn.externals.six.iteritems方法的典型用法代码示例。如果您正苦于以下问题：Python six.iteritems方法的具体用法？Python six.iteritems怎么用？Python six.iteritems使用的例子？那么...
python如何使数据加行_如何使用 Python 插入行
2020-12-15 12:15

weixin_39943586的博客如何使用 Python 插入行在表中插入行最简单的方法是使用非参数化 INSERT 语句，这意味着值作为 SQL 语句的一部分来指定。会为每个新行构建和执行一条新语句。在前面的示例中，需要游标才能执行 SQL 语句。以下示例...
使用Python Openssl库解析X509证书信息
2022-11-07 22:12

猫敷雪的博客对于常见的https证书一般是用crt或者pem来保存， http证书可电器网页前的锁按钮得到，并且进行...这里利用的是python3 的 Openssl 库进行解析，此库的说明文档如下，通过阅读说明文档，可以轻松读取证书相关信息。
python 爬虫 request get或post传参
2024-01-10 10:52

jieshenai的博客 python request get 和 post 参数示例，填充请求头和数据字段
【爬虫实战】使用Python和JS两种方式逆向网易云音乐接口并下载歌曲
2023-11-16 17:55

爬虫小恐龙的博客目前绝大部分网站只提供在线听歌的功能，几乎都无法下载，就算能下载也不能直接播放或者需要使用专有的播放器。那么如何获取歌曲的源文件呢？接下来以网易云为例下载某一首歌。本文使用两种JS逆向的方式，便于不同...
python爬虫学习代码1
2024-05-24 10:08

小贾日记的博客豆瓣电影排行榜信息爬取：通过指定请求头的参数，来获取想要的排行榜的区间。...百度翻译：利用爬虫技术模拟人工查询英文单词，将查到的信息保存到本地。网页采集器：输入关键字，获取目标网页关于关键字的信息。
动手学深度学习之如何理解param.grad / batch_size（详细讲解）
2023-02-09 19:44

我有明珠一颗的博客动手学深度学习之如何理解param.grad / batch_size（详细讲解）从上图计算过程可以看出，params.grad 其实是batch中所有样本的grad总和，所以这个时候除以batch_size就是相当于取一个平均值，这样就算下一次传入的...
python实现的登陆Discuz!论坛通用代码分享
2020-12-25 08:50

代码如下： #coding:gbk import urllib2,urllib,cookielib,re ''' 通用的登陆DZ论坛参数说明parms: username:用户名(必填), password :密码(必填), domain:网站域名，注意格式必须是：http://www.xxx.xx/...
platform驱动平台下，关于probe函数中，形参dev的“dev-＞dev.of_node；”的理解
2021-09-14 11:41

tatan王子的博客结构体定义如下： struct device { /*设备所依附的父设备，大多数情况下，这样的设备是某种总线或主控制器，如果该成员变量的值为NULL，表示当前设备是一个最顶端设备，通常这样的设备都不是你想得到的那个*/ struct...
python爬虫案例——猫眼电影数据抓取之字体解密，多套字体文件解密方法（20）
2024-11-25 17:17

盲敲代码的阿豪的博客目标网站：猫眼电影（https://www.maoyan.com/films?showType=2） >要求：抓取该网站下，所有即将上映电影的`预约人数`，保证能够获取到实时更新的内容
Android str_parms
2021-01-12 10:46

mnlife_的博客在了解android audio，梳理audio hal的流程时，遇到这样一个数据结构，struct str_parms, 查看代码的上下文，它在这里的主要功能是用来对各种参数进行set与get操作的。其底层采用hash map实现，并通过链接法解决哈希...
python 类初始化有参数声明变量_理解 Python 类的变量,方法与属性
2020-12-05 03:37

weixin_39731271的博客熟悉了传统的 C++/Java 类定义的风格，来感受一下 Python 是如何定义类的。...在理解 Python 类定义的同时头脑中应该闪现出 JavaScript/Java 如何定义类的情景。最简单的类定义class MyClass: pass由于cla...
500行代码实现Lisp解释器：Python元编程实战指南
2025-08-23 11:19

高鲁榕Jeremiah的博客本文将带你通过Python实现一个功能完整的Lisp解释器，掌握元编程核心技术，理解代码如何解析与执行。 ## 项目背景与价值 [pytudes](https://link.gitcode.com/i/a13242f982c4e25076cee70d3029e133)项目专注于通过...
python请求post无返回结果_Python请求POST返回不完整的内容
2020-12-12 11:48

weixin_39929961的博客我正在尝试使用Python Requests库下载csv文件 . 我正在使用Requests库，因为我首先必须通过免责声明页面，所以我使用Session对象存储所有cookie和所有爵士乐 . 我的POST请求一直返回，响应内容只是csv文件的前6行 . ...
【Python机器学习】模型评估与改进——带交叉验证的网格搜索
2024-07-02 13:48

zhangbin_237的博客由于带交叉验证的网格搜索是一种常用的调参方法，因此scikit-learn提供了GridSearchCV类，它以估计器的形式实现了这种方法。要使用GridSearchCV类，我们首先要用一个字典指定要搜索的参数。然后GridSearchCV会执行...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 3月13日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 3月5日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 2月21日