harrietttt 2021-09-17 21:08 采纳率: 100%
浏览 674
已结题

python提示 AttributeError: 'NoneType' object has no attribute 'text'

在抓取新闻标题时,用article.h2可以显示出新闻标题,但加上article.h2.text, 就出现如标题错误

import pandas as pd
import requests
import re
from bs4 import BeautifulSoup
from newspaper import Article

URL = "https://www.thepaper.cn/channel_25950"
r = requests.get(URL)
soup = BeautifulSoup(r.content, 'html5lib')
contents = []  # a list to store contents

table = soup.find('div', {'id': 'mainContent'})
![img](https://img-mid.csdnimg.cn/release/static/image/mid/ask/803789388136155.png "=600 #left")

# print(table) #for verifying result
news = table.findAll('div',attrs={'class': 'news_li'})
# print(news)
for article in news:
 try:
    content = {}
    content['Title'] = article.h2
    contents.append(content)
 except IndexError:
    pass

print(contents)



img

img

  • 写回答

1条回答 默认 最新

  • CSDN专家-showbo 2021-09-17 22:07
    关注

    因为最后一个news_li没有h2对象,所以article.h2为None,在调用text就出错了。需要先判断h2是否存在在获取text内容

    img


    有帮助麻烦点个采纳【本回答右上角】,谢谢~~

    for article in news:
     try:
        content = {}
        if article.h2!=None:#判断不是None在获取text
            content['Title'] = article.h2.text
            contents.append(content)
     except IndexError:
        pass
    print(contents)
    
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 9月25日
  • 已采纳回答 9月17日
  • 创建了问题 9月17日

悬赏问题

  • ¥15 对于知识的学以致用的解释
  • ¥50 三种调度算法报错 有实例
  • ¥15 关于#python#的问题,请各位专家解答!
  • ¥200 询问:python实现大地主题正反算的程序设计,有偿
  • ¥15 smptlib使用465端口发送邮件失败
  • ¥200 总是报错,能帮助用python实现程序实现高斯正反算吗?有偿
  • ¥15 对于squad数据集的基于bert模型的微调
  • ¥15 为什么我运行这个网络会出现以下报错?CRNN神经网络
  • ¥20 steam下载游戏占用内存
  • ¥15 CST保存项目时失败