python bs4 find_all 有一行没有该属性造成数据错位

想爬豆瓣读书的网页，在爬取评价星级时，某一条目没有这个层级的内容，所以使用BeautifulSoup的find_all功能时，数据错位了，怎么解决。可以用条件语句吗

titles=[]
authors=[]
ratings=[]
comments=[]

hds={'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36'}
source = requests.get('https://book.douban.com/tag/%E4%B8%AD%E5%9B%BD%E6%96%87%E5%AD%A6?start=280&type=R',headers=hds)
print(source.status_code)
print(source.text)
soup=bs.BeautifulSoup(source.content,'html.parser')

for t in soup.find_all('div',class_='info'):
        for title in t.find_all('h2',class_=""):
            print(title.text.strip())
            titles.append(title.text.strip().replace('\n',''))
for author in soup.find_all("div",class_="pub") :
        print(author.text.strip())
        authors.append(author.text.strip()) 

for rating in soup.find_all('div',class_='star clearfix'):
    if 
        print(rating.text)
        ratings.append(rating.text.strip())
for comment in soup.find_all('span',class_='pl'):
        print(comment.text.strip().replace('(','').replace('人评价)',''))
        comments.append(comment.text.strip().replace('(','').replace('人评价)',''))

图片说明

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
放风喽 2019-12-15 21:43
关注
ratings.append(rating.text.strip())
去掉空白？？？
《祁连如梦》没有评分，是不是去掉空白的时候，直接去掉了？？》

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

soup.find_all返回了空列表 list python
2022-04-11 19:59

回答 1 已采纳先打印soup看看是不是空,不行在用下面这句soup.find_all('div',attrs={"class":"item"})我看着你那样写没错的，我觉得可能soup就是空的
python爬虫bs4中用select如何获取属性值 python
2021-12-26 12:33

回答 2 已采纳 ```python from bs4 import BeautifulSoup import re html = """ <html><head><title>
Python爬虫，我用bs4的find方法为什么反回的是空值？怎么解决（已解决）？ python
2019-08-18 15:16

回答 1 已采纳 find找到空值，就证明没找到，你可以先打印request返回的内容，确认确实返回了内容再然后就是你的find查找标签，可能标签不对，先找上一级标签，print出来看行不行一级一级往下呗。
python中find函数爬虫_python,网页爬虫_网络数据采集的例子，有关find函数等等的疑问，python,网页爬虫 - phpStudy...
2021-03-17 15:46

移移的博客网络数据采集的例子，有关find函数等等的疑问来自 Python网络数据采集的例子：from urllib.request import urlopenfrom bs4 import BeautifulSoupimport datetimeimport randomimport rerandom.seed(datetime....
Python BeautifulSoup find_all 问题 python
2017-04-09 04:28

回答 1 已采纳 Unicode的内容，你可以用decode方法转换成你想要的编码方式。
Python 为什么用方法_init_定义了属性但运行时却显示没有 python
2020-03-01 22:49

回答 1 已采纳 ![图片说明](https://img-ask.csdn.net/upload/202003/02/1583112502_160596.jpg) 这是你的不仔细造成的，你的_init_方法两侧写
python如何打开文件并在第一行写入数据 python
2022-04-17 12:31

回答 3 已采纳你无法直接在文件开头插入数据。必须全部读出来，插入，重新写入 with open("path_to_file", "r") as f: contents = f.readlines() c
Python 数据采集、清洗、整理、分析以及可视化实战
2023-05-01 16:27

wespten的博客参考 Method-2 的处理过程，编写数据处理的自定义函数’pro_col’，并在 Method-2 的基础上拓展其他替换功能，使之适用于这四列数据（“Sales”，“Profits”，“Assets”，“Market_value”）。
python find_element_by_xpath()没有text(),那应该怎么获取totast中的内容 python selenium
2021-08-16 18:21

回答 1 已采纳 selenium---web页面定位toast - 测试-安静 - 博客园在写app的时候介绍toast的定位，在web测试过程中，也经常遇到一些toast，那么这个toast我们这边如何
Python re.findall怎么提取两个含符号的字符段中间的内容 python
2021-03-19 23:18

回答 6 已采纳 import re txt =''' <td class="abcde:0:no_22" style="white;"><center>需要提取的内容1</cente
python中re.findall()[0]后面的[0]什么意思 python 有问必答
2021-10-21 16:04

回答 2 已采纳 re.findall()返回是一个列表，加上[0]表示取列表索引位置为0 ，即获取其中的第一个元素。如对你有帮助，请采纳。点击我回答右上角【采纳】按钮。
获取基金数据python库_【Python 量化投资系列】python3 获取基金及历史净值数据
2020-12-04 00:34

weixin_39552472的博客 http://blog.csdn.net/yuzhucu/article/details/55261024最近开始想搭建一个个人投资研究的数据库，想从网上获取一些股票、基金类的数据，以便做进一步的数据分析。对比后发现天天基金网(东方财富)上基金数据相对还...
python re.findall方法截取字符串中某个字符后面的数字 python
2018-09-12 06:18

回答 2 已采纳通过眼力观察我看你写的没有问题，你可以换一个字符串试试，也知道你中间是不是出什么问题了，你这样写必须除数字外全匹配，中间出个什么错误或不一致，就蛋疼了，也可以用 a=re.findall(r'.
全网最全python爬虫系统进阶学习(附原代码)学完可就业
2021-05-02 23:47

yk 坤帝的博客第三章：爬虫数据分析（bs4,xpath,正则表达式) 1.bs4解析基础 2.bs4案例 3.xpath解析基础 4.xpath解析案例-4k图片解析爬取 5.xpath解析案例-58二手房 6.xpath解析案例-爬取站长素材中免费简历模板 7.xpath解析案例-...
【爬虫实战】01利用python爬虫并进行数据分析（链家爬虫）
2019-06-27 20:05

wifi连不上的博客爬虫实战01——利用python爬虫并进行数据分析爬取链家二手房相关信息并进行数据分析 {https://sh.lianjia.com/ershoufang/pg} 一、爬虫部分背景需求来源于生活大数据时代来临，数据就是核心，数据就是...
没有解决我的问题, 去提问

悬赏问题

¥15 ubuntu子系统密码忘记
¥15 信号傅里叶变换在matlab上遇到的小问题请求帮助
¥15 保护模式-系统加载-段寄存器
¥15 电脑桌面设定一个区域禁止鼠标操作
¥15 求NPF226060磁芯的详细资料
¥15 使用R语言marginaleffects包进行边际效应图绘制
¥20 usb设备兼容性问题
¥15 错误(10048): “调用exui内部功能”库命令的参数“参数4”不能接受空数据。怎么解决啊
¥15 安装svn网络有问题怎么办
¥15 vue2登录调用后端接口如何实现

python bs4 find_all 有一行没有该属性 造成数据错位

1条回答

悬赏问题

python bs4 find_all 有一行没有该属性造成数据错位