Chainguys 2021-09-30 13:34 采纳率: 93.6%
浏览 54
已结题

为啥我取不到p标签的数据?

import requests
from lxml import etree
from bs4 import BeautifulSoup
import time
import pandas as pd
proxies = {
    'https': 'http://127.0.0.1:10818',
    'http': 'http://127.0.0.1:10818'
}
hd = {
    "User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.159 Safari/537.36",
    "Accept": "application/json",
    "Cache-Control": "no-cache"
}
resp = requests.get('https://awesomepolygon.com/',headers=hd)
print(resp.status_code)
html = BeautifulSoup(resp.text,"lxml")
temp = html.find_all("div", class_="col-lg-4")
info=[]
for i in temp:
    name = i.find("h2", class_="crd-title").text.strip()
    short_des = i.find("p").get_text()
    url = i.find("a").get('href').strip()
    info.append([name,short_des,url])

返回:

200
Traceback (most recent call last):
File "/Users/paul/PycharmProjects/pythonProject/official/maticproject.py", line 22, in
short_des = i.find("p").get_text()
AttributeError: 'NoneType' object has no attribute 'get_text'

  • 写回答

1条回答 默认 最新

  • 於黾 2021-09-30 13:41
    关注

    temp = html.find_all("div", class_="col-lg-4")
    首先一个页面含有多个div,并不是每个div里面都会含有p标签
    你要判断啊,不能默认肯定能找到p标签

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 10月31日
  • 已采纳回答 10月23日
  • 创建了问题 9月30日

悬赏问题

  • ¥20 西门子S7-Graph,S7-300,梯形图
  • ¥50 用易语言http 访问不了网页
  • ¥50 safari浏览器fetch提交数据后数据丢失问题
  • ¥15 matlab不知道怎么改,求解答!!
  • ¥15 永磁直线电机的电流环pi调不出来
  • ¥15 用stata实现聚类的代码
  • ¥15 请问paddlehub能支持移动端开发吗?在Android studio上该如何部署?
  • ¥20 docker里部署springboot项目,访问不到扬声器
  • ¥15 netty整合springboot之后自动重连失效
  • ¥15 悬赏!微信开发者工具报错,求帮改