为啥我取不到p标签的数据？

import requests
from lxml import etree
from bs4 import BeautifulSoup
import time
import pandas as pd
proxies = {
    'https': 'http://127.0.0.1:10818',
    'http': 'http://127.0.0.1:10818'
}
hd = {
    "User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.159 Safari/537.36",
    "Accept": "application/json",
    "Cache-Control": "no-cache"
}
resp = requests.get('https://awesomepolygon.com/',headers=hd)
print(resp.status_code)
html = BeautifulSoup(resp.text,"lxml")
temp = html.find_all("div", class_="col-lg-4")
info=[]
for i in temp:
    name = i.find("h2", class_="crd-title").text.strip()
    short_des = i.find("p").get_text()
    url = i.find("a").get('href').strip()
    info.append([name,short_des,url])

200
Traceback (most recent call last):
File "/Users/paul/PycharmProjects/pythonProject/official/maticproject.py", line 22, in
short_des = i.find("p").get_text()
AttributeError: 'NoneType' object has no attribute 'get_text'

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
於黾 2021-09-30 13:41
关注
temp = html.find_all("div", class_="col-lg-4")
首先一个页面含有多个div，并不是每个div里面都会含有p标签
你要判断啊，不能默认肯定能找到p标签

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

为啥我取不到p标签的数据？ python
2021-09-30 13:34

回答 1 已采纳 temp = html.find_all("div", class_="col-lg-4")首先一个页面含有多个div，并不是每个div里面都会含有p标签你要判断啊，不能默认肯定能找到p标签
pyecharts画图只显示标签不显示数据？ python 有问必答
2021-04-27 09:54

回答 5 已采纳数据类型不对吧，这个值必须是数值型，你的列表可能不是这个类型。
Python爬虫 BeautifulSoup解析网页爬取内容为None python 有问必答
2021-08-31 14:07

回答 2 已采纳你抓的频率太快，IP被墙了
Python爬虫:从后端分析为什么你爬虫爬取不到数据
2023-06-08 21:44

坚持不懈的大白的博客仅仅是小编总结的三点而已，可能不是很全面，如果之后小编了解到新的知识点，可能还会增加的哈！
爬取数据html页面时标签之间的内容没有了 python 有问必答
2021-05-17 16:12

回答 5 已采纳可能页面是异步加载的，要F12分析页面数据加载的链接参数传递，对数据进行post或get,参考https://blog.csdn.net/qq_38396897/article/details/823
关于#python#的问题，如何解决？ python 爬虫
2023-03-07 17:40

回答 3 已采纳 “Devil组”引证GPT后的撰写：这个错误是由于文件写入时使用的默认编码为 'gbk'，而 p.text 中含有无法被 'gbk' 编码的字符。可以将文件的编码格式改为 'utf-8'，这样就可以处
从 html 激活/执行 python 脚本（通过 url 而不是 submit 按钮） ajax flask python
2023-02-02 18:16

回答 3 已采纳 from flask import Flask,render_template,request // 修改点 @app.route('/') def index(): myd
不知道天气咋样？一起用Python爬取天气数据分析告诉你
2021-07-28 09:15

Dragon少年的博客总体来说，我们需要先对天气网中的天气数据进行爬取，保存为csv文件，并将这些数据进行可视化分析展示。拆解需求，大致可以整理出我们需要分为以下几步完成：通过爬虫获取中国天气网7.20-7.21的降雨数据，包括...
请问用BeautifulSoup如何获取p标签内的值 python 爬虫
2015-10-11 14:32

回答 1 已采纳 http://zhidao.baidu.com/link?url=RwqRI-mffUi0v72naV59GVaAyDeFVECc6vtfaE82hwVWumkAUNGCSTGHi-et-WADdNO
Python爬虫requests.get方法无法显示div中折叠内容 https python 有问必答爬虫
2021-11-27 19:16

回答 2 已采纳该页面数据是动态加载的，需要用此链接用post请求去获取https://www.xuetangx.com/api/v1/lms/get_product_list/?page=1
使用tensorflow时在 '__init__.py' 中找不到引用 python tensorflow 机器学习
2021-05-03 17:32

回答 1 已采纳我把你的代码拿到本地跑了，首先你的代码的API是TF1.x版本的，我本地用的是tf1.15，所以第一步是把TF切换到1.15(我测试通过了，看你用Anaconda，那么安装就很简单了conda ins
python提取网页中p标签中的内容_外行学 Python 爬虫第三篇内容解析
2020-11-20 08:28

weixin_39667652的博客从网络上获取网页内容以后，需要从这些网页中取出有用的信息，毕竟爬虫的职责就是获取有用的信息，而不仅仅是为了下来一个网页。获取网页中的信息，首先需要指导网页内容的组成格式是什么，没错网页是由 HTML「我们...
python 爬虫问题：如何按照指定顺序爬取想要获取的信息，使用那种规则可以做到？ python 有问必答
2021-09-14 19:14

回答 1 已采纳你爬取所有的P标签之后再把第一删除不就好了
Python 爬取网页标签内数据
2022-03-08 15:05

Dragon-v的博客 1、先看运行效果，左边为运行后的结果，右边为爬取的网页内容 2、先展示代码 import requests from lxml import etree #爬取的网址 url = 'https://sh.fang.anjuke.com/?from=navigation' #请求头 header={...
python提取网页中p标签中的内容_使用Python进行爬虫的初学者指南
2020-11-09 10:10

weixin_39776298的博客大多数网站不允许你保存他们网站上的数据供你使用。因此，唯一的选择是手动复制数据，这将消耗大量时间，甚至可能需要几天才能完成。网站上的数据大多是非结构化的。Web抓取有助于将这些非结构化数据，并将其以...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 10月31日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 10月23日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 9月30日

悬赏问题

¥20 西门子S7-Graph,S7-300，梯形图
¥50 用易语言http 访问不了网页
¥50 safari浏览器fetch提交数据后数据丢失问题
¥15 matlab不知道怎么改，求解答！！
¥15 永磁直线电机的电流环pi调不出来
¥15 用stata实现聚类的代码
¥15 请问paddlehub能支持移动端开发吗？在Android studio上该如何部署？
¥20 docker里部署springboot项目，访问不到扬声器
¥15 netty整合springboot之后自动重连失效
¥15 悬赏！微信开发者工具报错，求帮改

为啥我取不到p标签的数据？

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新