爬虫网页使用Beautifulsoup遍历网页时总是没有'children'模块

import requests
import bs4
from bs4 import BeautifulSoup
import re

def getHTMLText(url):
try:
r = requests.get(url, timrout = 30)
r.raise_for_status()
r.encoding = r.apparent_encoding
return r.text
except:
return ""

def fillUnivList(ulist, html):
soup = BeautifulSoup(html, "html.parser")
for tr in soup.find('tbody').children:
if isinstance(tr, bs4.element.Tag):
tds = tr('td')
ulist.append([tds[0].string,tds[1].string,tds[2].string])

def printUnivList(ulist, num):
print("{:^10}\t{:^10}\t{:^10}".format("排名","大学名称","总分"))
for i in range(num):
u = ulist[i]
print("{:^10}\t{:^10}\t{:^10}".format(u[0],u[1],u[2]))

def main():
#num = int(raw_input("请输入您要查询的大学数："))
unifo = []
url = "http://www.gaokaopai.com/paihang-otype-2.html?f=1&ly=bd&city=&cate=&batch_type="
html = getHTMLText(url)
fillUnivList(unifo, html)
printUnivList(unifo,10)
main()

错误提示：AttributeError: 'NoneType' object has no attribute 'children'

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
淮左青衣 2017-08-05 13:48
关注
已解决，原来是getHTMLText（)中出错了,连最基本的网页都没有获取到，soup.find('tbody')返回的对象肯定是空的，也就不可能有children属性

解决 3
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

使用Python爬虫库BeautifulSoup遍历文档树并对标签进行操作详解
2020-09-18 01:19

### 使用Python爬虫库BeautifulSoup遍历文档树并对标签进行操作详解在现代网络数据抓取及处理领域，Python凭借其强大的第三方库支持而成为首选工具之一。其中，BeautifulSoup库因其简洁易用且功能强大而在HTML和...
【爬虫】2.4 BeautifulSoup遍历文档元素
2023-02-24 22:32

即使再小的️帆也能远航的博客 BeautifulSoup遍历文档元素上行遍历下行遍历平行遍历
Python使用BeautifulSoup进行网页爬虫技术详解
2024-08-18 10:00

傻啦嘿哟的博客 BeautifulSoup是一个可以从HTML或XML文件中提取数据的Python库。它基于解析器将复杂的HTML文档转换为易于理解的树形结构，...通过本文，我们详细介绍了Python中使用BeautifulSoup库进行网页爬虫的基本知识和进阶技巧。
python爬虫学习笔记之Beautifulsoup模块用法详解
2020-09-17 14:28

**Python 爬虫Beautifulsoup模块详解** 在Python爬虫领域，Beautifulsoup是一个不可或缺的工具，它是一个用于从HTML或XML文件中提取数据的库。它提供了简单的API，使得开发者可以方便地对网页进行导航、搜索和修改...
爬虫入门二 beautifulsoup
2024-12-28 16:05

黑客KKKing的博客 BeautifulSoup 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过转换器实现文档导航、查找、修改。
python爬虫：BeautifulSoup_遍历文档树
2020-01-16 22:34

不怕猫的耗子A的博客在做自动化时，需要解析XML报文，前面虽然学习过下BeautifulSoup，结果这次在写脚本时，突然发现前面学的还不是很全(当时也没想到会用到这么多，就随便了解了下)，所以现在又得在回顾、补充下 2、在实际写的时候...
python学习爬虫（5）--BeautifulSoup遍历文档树：.contens, .children, .descendants等
2019-03-28 11:40

IT小样的博客本篇主要介绍对BeautifulSoup的引用，以之前教程中的HTML为例： html_doc = ''' <html><head><title>hello,tester</title></head><body> <p class="title"><b><...
BeautifulSoup 库的使用——python爬虫
2025-04-20 15:18

freejackman的博客本文主要介绍了python爬虫中的BeautifulSoup库的安装和使用,包括它如何解析html代码，如何查找元素等
38 爬虫 - BeautifulSoup4遍历文档树
2019-08-30 09:25

杨林伟的博客 1. 直接子节点：.contents .children 属性 1.1 .content tag 的 .content 属性可以将tag的子节点以列表的方式输出 print soup.head.contents #[<title>The Dormouse's story</title>] 输出方式为列表...
学习笔记：BeautifulSoup的3种遍历方式
2021-12-19 21:23

法迪的博客标签树的下行遍历</h3> <table><thead><tr><th>属性</th><th>说明</th></tr></thead><tbody><tr><td>.contents</td><td>子节点的列表，将所有儿子节点存入列表</td></tr><tr><td>.children</td><td>子节点的迭代...
没有解决我的问题, 去提问

爬虫网页使用Beautifulsoup遍历网页时 总是 没有'children'模块

3条回答 默认 最新

爬虫网页使用Beautifulsoup遍历网页时总是没有'children'模块

3条回答默认最新