求助一个beautifulsoup的问题

在写一个爬知乎的爬虫。
在爬取一个话题的父话题和子话题。
这段代码list = soup.find_all(class_="zm-item-tag")将父话题和子话题全部放到了一个list中，不能区分。
如果设置两个list分别包含子话题和父话题？单独解析父话题和子话题的代码如何写？
如图所示父话题是生活情趣
子话题是养生平台养胃图片说明

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
threenewbee 2016-02-12 01:27
关注
先分别zm-topic-manage-item，判断h3，然后再在内部找zm-item-tag

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

求助一个beautifulsoup的问题 python 爬虫
2016-02-12 01:21

回答 3 已采纳先分别zm-topic-manage-item，判断h3，然后再在内部找zm-item-tag
关于python2使用beautifulsoup定位元素的问题
2017-08-07 07:35

回答 1 已采纳这是我之前写的一个爬虫，或许可以参考一下： https://github.com/Tangworld/CodeDefectLocation/blob/master/getdata/Aspectj/c
初学者，请教一下 BeautifulSoup 的问题 python 有问必答
2021-06-06 10:13

回答 4 已采纳 from bs4 import BeautifulSoup from urllib.request import urlopen import re html = urlopen('ht
书生浦语大模型实战训练营第二期第三节--茴香豆RAG知识助手实战部署--homework
2024-04-13 18:54

智能提桶工程师的博客所谓的语料也就是新增知识数据，也就是这个小逼崽子的饲料，拿这些语料去数据去喂它它才能知道这么回答你问题（本地的语料数据库）----（后面会教你接通互联网，就可以直接用外界互联网的数据库来补充茴香豆的知识库...
beautifulsoup python
2023-02-22 12:27

回答 2 已采纳该回答内容部分引用GPT，GPT_Pro更好的解决问题上述代码有错误，主要是open的括号中的example htmi不是一个有效的文件路径，所以无法打开对应的文件；此外，BeautifulSoup函
python使用BeautifulSoup遇到的问题 python
2018-03-21 09:23

回答 4 已采纳 bsObj=BeautifulSoup(html, "html.parser",from_encoding='utf-8') 试试html.parser
beautifulSoup4爬虫问题，python简单代码请教一下 python 有问必答爬虫
2022-01-15 17:29

回答 1 已采纳就是获取 soup.find_all("script", type="text/javascript") 返回的结果，取第3个元素的文本。
学习笔记 | 茴香豆：搭建你的RAG智能助理
2024-04-18 13:22

DrFlown的博客检索过程中，茴香豆会将输入问题与两个列表中的问题在向量空间进行相似性比较，判断该问题是否应该回答，避免群聊过程中的问答泛滥。增强搜索利用知识领域的源文件建立图数据库，当模型判断问题为无关问题或回答失败...
使用BeautifulSoup或golang colly解析HTML时遇到问题 python
2018-07-12 07:23

回答 1 已采纳 It looks to me like the HTML is actually commented out, so that's why BeautifulSoup can't find it.
beautifulsoup如何提取HTML文件中两个相同标签之间的文本？ python 爬虫
2022-07-28 20:30

回答 3 已采纳建议还是使用正则表达式提取会节省内存，主要是由于文件过大，如果使用lxml、bs，会构建完整的数据结构，就会造成内存不足。假设文件是data.html，使用compile对象和re.finditer能
Python BeautifulSoup find_all 问题 python
2017-04-09 04:28

回答 1 已采纳 Unicode的内容，你可以用decode方法转换成你想要的编码方式。
三、“茴香豆”：搭建你的 RAG 智能助理
2024-04-28 21:55

aJupyter的博客 models/maidalun1020/bce-reranker-base_v1 /root/models/bce-reranker-base_v1 # 复制大模型参数（下面的模型，根据作业进度和任务进行**选择一个**就行） ln -s /root/share/new_models/Shanghai_AI_Laboratory/...
用BeautifulSoup4 解析html的内容
2018-05-05 07:01

回答 2 已采纳 soup = BeautifulSoup(html, 'html.parser') # html为您的html内容 text = soup.find('div').text
【InternLM 实战营第二期-笔记3】茴香豆：搭建你的 RAG 智能助理
2024-04-12 13:16

Oven_maizi的博客大模型的训练时间在前...（不需要训练，解决新增知识的问题）Rag(retrieval augmented generation)是一种结合了检索（retrieval)和生成（generation)的技术，旨在通过利用外部知识库来增强大型语言模型（llms)的性能。
【InternLM 实战营第二期笔记】使用茴香豆搭建你的RAG智能助理
2024-04-07 06:51

JeffDingAI的博客茴香豆是一个基于 LLM 的群聊设计拒答、响应两阶段 pipeline 应对群聊场景，解答问题同时不会消息泛滥。精髓见技术报告成本低至 1.5G 显存，无需训练适用各行业提供一整套前后端 web、android、算法源码，工业级开源...
没有解决我的问题, 去提问

悬赏问题

¥15 mmocr的训练错误，结果全为0
¥15 python的qt5界面
¥15 无线电能传输系统MATLAB仿真问题
¥50 如何用脚本实现输入法的热键设置
¥20 我想使用一些网络协议或者部分协议也行，主要想实现类似于traceroute的一定步长内的路由拓扑功能
¥30 深度学习，前后端连接
¥15 孟德尔随机化结果不一致
¥15 apm2.8飞控罗盘bad health，加速度计校准失败
¥15 求解O-S方程的特征值问题给出边界层布拉休斯平行流的中性曲线
¥15 谁有desed数据集呀

求助一个beautifulsoup的问题

3条回答 默认 最新

悬赏问题

3条回答默认最新