请问这部分代码是什么意思呢

如下图这部分代码是什么意思？有什么用呢？

完整代码如下

import requests
from lxml import etree
from bs4 import BeautifulSoup
from requests.exceptions import RequestException

soup1=BeautifulSoup(open('C:/Users/25443/PycharmProjects/pythonProject1/知乎hot页面.html',encoding='utf-8'),'lxml')
soup2=BeautifulSoup('<html>data<html>','lxml')


def get_page():
    try:
        headers = {
            'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.4951.54 Safari/537.36',
            'cookie': r'_zap=185c368f-cac1-4124-8b97-6566c098a61d; d_c0="AEDfyG990RSPTrcXcq6AscVaAKM-SfvUl2I=|1650436018"; __snaker__id=CZaIBtjh7BGI0fe3; _9755xjdesxxd_=32; YD00517437729195%3AWM_TID=1MGOQ0YHQwZEBQEREAbEBHAyzS5C3RUR; q_c1=986cc29497854513b6ae85c82f874233|1650436058000|1650436058000; _xsrf=ca50ce23-6c53-499f-a783-541bbf89e40f; SESSIONID=x7LKH0X9dfWzWJ2ChMfsQme5YWCw9iYnLs9eOV0Tvlb; JOID=U10QBUmU-LkFdm3gG5PPY_cBFzYL6M_2Sj1ZuCHzmu58JSTWWNYoy2BxaeMcJTUeaDBulq-8tPjN1BwrJQqU4QI=; osd=VF0cAEyT-LUAc2rgF5bKZPcNEjMM6MPzTzpZtCT2ne5wICHRWNotzmdxZeYZIjUSbTVplqO5sf_N2BkuIgqY5Ac=; Hm_lvt_98beee57fd2ef70ccdd5ca52b9740c49=1650436017,1651221589,1651456645,1652075624; Hm_lpvt_98beee57fd2ef70ccdd5ca52b9740c49=1652090638; NOT_UNREGISTER_WAITING=1; gdxidpyhxdE=vhvSfmVey%2Fri2W%2BycmMJkM9wrOZ6Up8beup29UV997RDp0t1n%5CHlerKCLqSfEoPNNaQpD8M0jhULcgBjPZf9AfAuR2r83Sfsvb1nkxSzhNU8ibLcLl%2Bn35mGq7PfZ259OIGYJR5uW96L3w4A66PISuRTh2kAp%2FKHpn%2B7oSZyqcfLkLUL%3A1652092748568; YD00517437729195%3AWM_NI=y6XOSx82ILdIJiTE6%2F76xQHdhyiHhes6ZnijqsZAqjRftAoBo3y0LqLWBmH8GsLSTa1TuZPb%2BIt75iUODtARR9kfkJZ76O4CGrPeAMvbucFEyHf7Sqa19K93dccnr1YdU1Y%3D; YD00517437729195%3AWM_NIKE=9ca17ae2e6ffcda170e2e6ee87d94f9c899cd5e54287b88fa6c54e838e9eb0c54ea1b68fbbf37083efa3b4b82af0fea7c3b92abbea98b0d274fcee87ade7438ab79ca6b525f5eab8b2cb70aca7a7a9eb6fb1ea968fec62b3ad96a2f46292babca2ee4aadedb7d1cf7b90898e8ecb3485ad84b4d76bf38cbbbbd36ae997bcd8b86397918c95c45a92e7a587ea429ae9fab0b74985aea086c447b6bebb84c54fbb98aad8d27ba3eff7acbc39a8bdad8ff13b9bbc9bd2dc37e2a3; captcha_session_v2=2|1:0|10:1652092266|18:captcha_session_v2|88:ZGV1WEc5eVlPbXY3dEVVRkQ5dm1uZzRoV1hwRVlOak5PZ2ZlOGh3ZWZhdVNTZmhZcEladkYyQWt0UzVpKzNlVQ==|6601828d4cb02c5a70c72e399078a6819ddb1b6b38ee9ee4c92930f3682bc2df; captcha_ticket_v2=2|1:0|10:1652092274|17:captcha_ticket_v2|704:eyJ2YWxpZGF0ZSI6IkNOMzFfNkRZNnp4WFBGZldvQTFOd21FbFBFYWh4S184MHp0N1NxeDR4SWhpWGhHZnVkYlV0YVZXTGJJQk1YTHF3ZkxMd3lVekh5dUlkRzVIa1Nrc05FSno1OVhHQ3Z1MWdWNmNmajgyeHBnTFZLaS5xRzlGS19YZHJJWmNVSUdyay5XREFrVnpGdmhqVHg2UnVVQy1BTVk5UU84bXFkcFV0SUVobzh3aXVFcVZDdUtONmtlWGE1ZDY2RWVMMUt5NTU0em9HWVVQMGRyS1F1R0hYYXk3Q2ZtaktBei5FNnpubU9CUnpuMjl2dHlZeVF1SVVfbF9RX0JoYi1sTTFHTVVKd1pQb3Mxc3YtMS5nZnZ5ZHlsUG1CX3l6YmVGckFYak9wUVhfMFpxdjluOS5XeTkwc1ZKdkJOQjlSWHQuUFdyRGc3d0F1dmtNS0N4cVd0WndDQ182MmZob1VJUUtScHltY1pDUHZmbWNydXpYWThVbHNzXzhKY0lKdTRkblIxbk1fc2VlUFZDS1gwd3FZUWF5djRlRUEuSWNnS2FoLUZUNVd0b1FOUzE2MG1KZ1pvYkRGcjh5dXVtcy1IaGlSaDlsRlJEQTdhUEtyTzhkcDhYRld0LXUucFZhdjZTQkVRcl8xNWJ6Rml1LmltcGhDRUdUNGx4U2YxOGMyaUlfTGxGMyJ9|6a44cf5c65e83bb4dc814673fabfd4e10f679bda96786eec47a18c964f226812; z_c0=2|1:0|10:1652092290|4:z_c0|92:Mi4xQmNSWEN3QUFBQUFBUU5fSWIzM1JGQ1lBQUFCZ0FsVk5nanRtWXdEbDNHY3lwVmk3NzdfRHdVdFpoVDJ1T1lLLTBB|946777c30298838362de16cacae524be1a230e876feea46f729cd47f7ccbca5e; tst=h; KLBRSID=fe0fceb358d671fa6cc33898c8c48b48|1652092310|1652071589'
        }
        response = requests.get('https://www.zhihu.com/hot', headers=headers)
        if response.status_code == 200:
            print("网页获取成功..."+response.text)
            return response
        else:
            print("网页获取失败...")
    except RequestException:
        return 'Request出现异常错误'

def parse_one_page_bs(response):
    html = response.text
    soup = BeautifulSoup(html.replace('\n',''),'lxml')
    for section in soup.select(".HotItem"):
        excerpt = [x for x in section.a.strings]
        if len(excerpt)==2:
            hotItem_excerpt = excerpt[1]
        else:
            hotItem_excerpt = ''
        yield{
            '热榜排名':section.select_one('.HotItem-rank').string,
            '热榜链接':section.find("div",attrs={"class":"HotItem-content"}).a['href'],
            '热榜标题':section.h2.string,
            '热榜内容':hotItem_excerpt,
            '热度1':[x for x in section.select_one('div.HotItem-metrics').strings][0].replace('热度','').strip(),
            '热度2':section.select_one('div.HotItem-metrics').contents[2].replace('热度','').strip(),
        }

if __name__ == '__main__':
    response = get_page()
    for item in parse_one_page_bs(response):
        print(item)

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

溪风沐雪 2022-05-10 23:02

关注

 for section in soup.select(".HotItem"): #遍历所有class为.HotItem的节点
        excerpt = [x for x in section.a.strings] #把节点中的a标签的内容生成一个数组
        if len(excerpt)==2: #如果数组长度为2
            hotItem_excerpt = excerpt[1] #取第2个元素作为 标题或者看名称可能是热搜摘要一类的
        else: #如果数组长度步为2，标题设为空
            hotItem_excerpt = ''

本回答被题主选为最佳回答 , 对您是否有帮助呢?

1人已打赏

报告相同问题？

关注问题

python yield是什么意思_python yield有什么用
2021-03-17 02:41

自闭成年人的博客 yield是一个常用于python函数定义中的关键字，它的作用是返回一个可以用来迭代(for循环)的生成器，它的应用场景通常为一个需要返回一系列值的，含有循环的函数中。如果想要彻底搞懂yield关键词的用法，你务必先要搞...
python注释是什么意思_python中注释的意思是什么
2021-02-10 17:35

weixin_39983383的博客 python中注释的意思是什么发布时间：2020-09-03 14:31:29来源：亿速云阅读：106作者：小新这篇文章主要介绍了python中注释的意思是什么，具有一定借鉴价值，需要的朋友可以参考下。希望大家阅读完这篇文章后大有收获...
python虚拟环境是什么意思_Python虚拟环境详解
2020-12-03 01:31

weixin_39716703的博客和其他大多数现代编程语言一样，Python对包和模块的下载、存储以及管理有其自己的一套方法。Python的包一般存在几个地方。比如，大部分系统包会存在sys.prefix指定的路径下。在Mac OS X下这个路径为：>>> ...
python中步长什么意思,python步长是什么
2021-04-27 01:44

不知诶的博客 = 1: n = step % len(lt) lt.pop(n - 1) else: if step == 1: return (lt[-1]) else: return lt[0]``` 以上就是python步长的介绍，本篇涉及到了有关切片的知识点，大家如果对这部分有所遗忘，可以重新...
python的api是什么意思_python中api的使用方法是什么
2021-03-06 18:17

温二爷的博客 python中api的使用方法是什么发布时间：2020-07-31 13:48:21来源：亿速云阅读：77作者：清晨小编给大家分享一下python中api的使用方法是什么，希望大家阅读完这篇文章后大所收获，下面让我们一起去探讨吧！...
python sdk是什么意思_什么是 SDK？
2020-12-18 10:52

weixin_39888412的博客通俗而言：1、其实很简单，SDK 就是 Software Development Kit 的缩写，中问意思是：软件开发工具包。2、这是一个覆盖面相当广泛的名词，可以这么说：辅助开发某一类软件的相关文档、范例和工具的集合都可以叫做...
python跑模型是什么意思_django模型是什么意思
2021-02-11 03:47

罗思明的博客模型是一个定义数据源的数据，它包含要存储数据的一些属性和...Django提供了自动生成的数据库访问API，使用模型操作数据库很方便模型案例下面的代码定义了Person模型，有first_name和last_name:fromdjango.dbimport...
python中import是什么意思_python中的import指的是什么
2020-11-20 23:15

weixin_39703773的博客 Python中的import语句是用来调用模块的。一、module通常模块为一个文件，直接使用import来导入就好了。可以作为module的文件类型有".py"、".pyo"、".pyc"、".pyd"、".so"、".dll"。二、package通常包总是一个目录，...
python中的pass是什么意思_Python中pass的作用与使用教程
2021-03-05 20:20

weixin_39635432的博客 Python中pass的作用空语句 do... //do nothingelse{//do something}对应于python就要这样写：if true:pass #do nothingelse:#do something###1 pass语句在函数中的作用当你在编写一个程序时，执行语句部分思路还没有...
python如何执行部分代码_python如何运行代码
2021-03-06 01:40

机智的大群主的博客当Python运行脚本时，在代码开始进行处理之前，Python还会执行一些步骤。(推荐学习：Python视频教程)第一步是编译成所谓的“字节码”，如果Python进程拥有写入权限，将把程序的字节码保存为一个以.pyc为扩展名的文件...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 5月18日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 5月10日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月10日

请问这部分代码是什么意思呢

1条回答 默认 最新

问题事件

1条回答默认最新