harrietttt 2021-09-17 21:08 采纳率: 100%
浏览 709
已结题

python提示 AttributeError: 'NoneType' object has no attribute 'text'

在抓取新闻标题时,用article.h2可以显示出新闻标题,但加上article.h2.text, 就出现如标题错误

import pandas as pd
import requests
import re
from bs4 import BeautifulSoup
from newspaper import Article

URL = "https://www.thepaper.cn/channel_25950"
r = requests.get(URL)
soup = BeautifulSoup(r.content, 'html5lib')
contents = []  # a list to store contents

table = soup.find('div', {'id': 'mainContent'})
![img](https://img-mid.csdnimg.cn/release/static/image/mid/ask/803789388136155.png "=600 #left")

# print(table) #for verifying result
news = table.findAll('div',attrs={'class': 'news_li'})
# print(news)
for article in news:
 try:
    content = {}
    content['Title'] = article.h2
    contents.append(content)
 except IndexError:
    pass

print(contents)



img

img

  • 写回答

1条回答 默认 最新

  • CSDN专家-showbo 2021-09-17 22:07
    关注

    因为最后一个news_li没有h2对象,所以article.h2为None,在调用text就出错了。需要先判断h2是否存在在获取text内容

    img


    有帮助麻烦点个采纳【本回答右上角】,谢谢~~

    for article in news:
     try:
        content = {}
        if article.h2!=None:#判断不是None在获取text
            content['Title'] = article.h2.text
            contents.append(content)
     except IndexError:
        pass
    print(contents)
    
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 9月25日
  • 已采纳回答 9月17日
  • 创建了问题 9月17日

悬赏问题

  • ¥15 metadata提取的PDF元数据,如何转换为一个Excel
  • ¥15 关于arduino编程toCharArray()函数的使用
  • ¥100 vc++混合CEF采用CLR方式编译报错
  • ¥15 coze 的插件输入飞书多维表格 app_token 后一直显示错误,如何解决?
  • ¥15 vite+vue3+plyr播放本地public文件夹下视频无法加载
  • ¥15 c#逐行读取txt文本,但是每一行里面数据之间空格数量不同
  • ¥50 如何openEuler 22.03上安装配置drbd
  • ¥20 ING91680C BLE5.3 芯片怎么实现串口收发数据
  • ¥15 无线连接树莓派,无法执行update,如何解决?(相关搜索:软件下载)
  • ¥15 Windows11, backspace, enter, space键失灵