harrietttt 2021-09-17 21:08 采纳率: 100%
浏览 675
已结题

python提示 AttributeError: 'NoneType' object has no attribute 'text'

在抓取新闻标题时,用article.h2可以显示出新闻标题,但加上article.h2.text, 就出现如标题错误

import pandas as pd
import requests
import re
from bs4 import BeautifulSoup
from newspaper import Article

URL = "https://www.thepaper.cn/channel_25950"
r = requests.get(URL)
soup = BeautifulSoup(r.content, 'html5lib')
contents = []  # a list to store contents

table = soup.find('div', {'id': 'mainContent'})
![img](https://img-mid.csdnimg.cn/release/static/image/mid/ask/803789388136155.png "=600 #left")

# print(table) #for verifying result
news = table.findAll('div',attrs={'class': 'news_li'})
# print(news)
for article in news:
 try:
    content = {}
    content['Title'] = article.h2
    contents.append(content)
 except IndexError:
    pass

print(contents)



img

img

  • 写回答

1条回答 默认 最新

  • CSDN专家-showbo 2021-09-17 22:07
    关注

    因为最后一个news_li没有h2对象,所以article.h2为None,在调用text就出错了。需要先判断h2是否存在在获取text内容

    img


    有帮助麻烦点个采纳【本回答右上角】,谢谢~~

    for article in news:
     try:
        content = {}
        if article.h2!=None:#判断不是None在获取text
            content['Title'] = article.h2.text
            contents.append(content)
     except IndexError:
        pass
    print(contents)
    
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 9月25日
  • 已采纳回答 9月17日
  • 创建了问题 9月17日

悬赏问题

  • ¥15 虚幻5 UE美术毛发渲染
  • ¥15 CVRP 图论 物流运输优化
  • ¥15 Tableau online 嵌入ppt失败
  • ¥100 支付宝网页转账系统不识别账号
  • ¥15 基于单片机的靶位控制系统
  • ¥15 真我手机蓝牙传输进度消息被关闭了,怎么打开?(关键词-消息通知)
  • ¥15 装 pytorch 的时候出了好多问题,遇到这种情况怎么处理?
  • ¥20 IOS游览器某宝手机网页版自动立即购买JavaScript脚本
  • ¥15 手机接入宽带网线,如何释放宽带全部速度
  • ¥30 关于#r语言#的问题:如何对R语言中mfgarch包中构建的garch-midas模型进行样本内长期波动率预测和样本外长期波动率预测