harrietttt 2021-09-17 21:08 采纳率: 100%
浏览 685
已结题

python提示 AttributeError: 'NoneType' object has no attribute 'text'

在抓取新闻标题时,用article.h2可以显示出新闻标题,但加上article.h2.text, 就出现如标题错误

import pandas as pd
import requests
import re
from bs4 import BeautifulSoup
from newspaper import Article

URL = "https://www.thepaper.cn/channel_25950"
r = requests.get(URL)
soup = BeautifulSoup(r.content, 'html5lib')
contents = []  # a list to store contents

table = soup.find('div', {'id': 'mainContent'})
![img](https://img-mid.csdnimg.cn/release/static/image/mid/ask/803789388136155.png "=600 #left")

# print(table) #for verifying result
news = table.findAll('div',attrs={'class': 'news_li'})
# print(news)
for article in news:
 try:
    content = {}
    content['Title'] = article.h2
    contents.append(content)
 except IndexError:
    pass

print(contents)



img

img

  • 写回答

1条回答 默认 最新

  • CSDN专家-showbo 2021-09-17 22:07
    关注

    因为最后一个news_li没有h2对象,所以article.h2为None,在调用text就出错了。需要先判断h2是否存在在获取text内容

    img


    有帮助麻烦点个采纳【本回答右上角】,谢谢~~

    for article in news:
     try:
        content = {}
        if article.h2!=None:#判断不是None在获取text
            content['Title'] = article.h2.text
            contents.append(content)
     except IndexError:
        pass
    print(contents)
    
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 9月25日
  • 已采纳回答 9月17日
  • 创建了问题 9月17日

悬赏问题

  • ¥15 信号发生器如何将频率调大,步尽值改成10
  • ¥15 keil 5 编程智能家具,风扇台灯开关,人体感应等
  • ¥100 找一名渗透方面的专家
  • ¥20 使用Matlab gui设计一个插补小程序
  • ¥15 evo评估时曲线出现问题
  • ¥15 eNSP拓扑图配置实验
  • ¥20 有没有兄弟会替换fmod studio的.bank文件内的音效?
  • ¥20 如何解决访问网址被屏蔽的情况
  • ¥20 powerbuilder datawindow控件导出Excel数据,可不可以不自动覆盖原数据,而是在后面新插入入数据。
  • ¥15 telegram 问题