用python做爬虫出现错误如何调试

错误：Traceback (most recent call last): File "F:\学习资料\大学计算机\Python简单网页爬虫示例\Python简单网页爬虫示例\大学排名\大学排名.py", line 33, in main() File "F:\学习资料\大学计算机\Python简单网页爬虫示例\Python简单网页爬虫示例\大学排名\大学排名.py", line 31, in main fillUnivList(uinfo,html) File "F:\学习资料\大学计算机\Python简单网页爬虫示例\Python简单网页爬虫示例\大学排名\大学排名.py", line 15, in fillUnivList for tr in soup.find('tbody').children: AttributeError: 'NoneType' object has no attribute 'children' >>> 这是原代码 from bs4 import BeautifulSoupimport bs4import requestsdef getHTMLText(url): try: r=requests.get(url,timeout=30) r.raise_for_status() r.encoding=r.apparent_encoding return r.text except: return ""def fillUnivList(ulist,html): soup=BeautifulSoup(html, "html.parser") for tr in soup.find('tbody').children: if isinstance(tr, bs4.element.Tag): tds=tr('td') ulist.append([tds[0].string,tds[1].string,tds[2].string])def printUnivList(ulist,num): print("{:^10}\t{:^6}\t{:^10}".format("排名","学校名称","分数")) for i in range(num): u=ulist[i] print("{:^10}\t{:^6}\t{:^10}".format(u[0],u[1],u[2])) print("Suc"+str(num))def main(): uinfo=[] url="https://www.shanghairanking.cn/rankings/bcur/2021.html" #排名网址 html=getHTMLText(url) fillUnivList(uinfo,html) printUnivList(uinfo,1000)main()import pandas as pdrank=pd.read_html('https://www.shanghairanking.cn/rankings/bcur/2021.html')rank[0]=rank[0].iloc[:,:]rank[0].to_csv("中国大学排名.csv",ending='utf_8_sig')print("Successful")

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
江天暮雪丨 2021-05-22 12:30
关注
首先，提问可以选择代码段插入，眼睛舒服点。。

# 插入代码段 print('demo')

然后，你的问题，错误信息已经很明确了，你想获取children属性：for tr in soup.find('tbody').children，但是你的soup.find('tbody')是个空，也就是没选中元素tbody，自然无法获取到它的属性children
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python爬虫代码出现错误 python 爬虫
2022-08-23 16:00

回答 1 已采纳导入了太多没有用的模块，参考我的代码： import requests #发送HTTP请求 from bs4 import BeautifulSoup headers ={ "User-Age
Python爬虫程序出现错误如何修改 python
2022-07-22 11:10

回答 2 已采纳控制台 pip install requests
用python做爬虫遇到的问题 python 爬虫
2021-09-11 14:26

回答 2 已采纳
2：python网络爬虫权威指南_python网络爬虫权威指南_python爬虫指南_
2021-09-29 18:35

网络爬虫（又称为网页蜘蛛，网络机器人，在FOAF社区中间，更经常的称为网页追逐者），是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。
尝试python爬虫时出现错误，求解答！ python 有问必答正则表达式爬虫
2021-11-19 23:19

回答 1 已采纳 re.findall(findChara, str(item)) 没有匹配到，返回的是空列表[] print(str(item)) 输出没有<h3></h3>标签你题目
Python爬虫配合VPN爬取出现报错 python 爬虫
2021-12-22 17:33

回答 1 已采纳你这个是VPN代理问题，你可以将VPN设置成部分代理，不要全部代理你的网络。
Python爬虫出现了问题如何调试 python 有问必答
2021-05-22 10:56

回答 4 已采纳这个错误是说你对了“None调用了 text 属性. 应该是调用 text 属性.的对象没有正确获取到。对象的值获取的是None 你发一下代码来看看
python爬虫：Python 爬虫知识大全
2024-06-22 14:59

python爬虫：Python 爬虫知识大全； python爬虫：Python 爬虫知识大全； python爬虫：Python 爬虫知识大全； python爬虫：Python 爬虫知识大全； python爬虫：Python 爬虫知识大全； python爬虫：Python 爬虫知识...
python爬虫问题求解 python 爬虫
2022-04-29 11:12

回答 1 已采纳我给你改了一下，你对比看看吧： from bs4 import BeautifulSoup import pandas as pd import requests def crawer_travel
python爬虫 requests模块错误 python 爬虫
2023-03-06 21:55

回答 3 已采纳 curr_url 没有获取到数据，提交了一个None，结果访问的地址就是 http://None了
python爬虫加载js文件错误 python 爬虫
2021-11-20 10:30

回答 1 已采纳你应该把js发出来的把js放到浏览器控制台执行以下看看是否有问题，如果正常运行则说明你本地的环境不符，建议安装nodejs再尝试爬虫逆向社区-爬虫逆向论坛-CSD
Python爬虫开发实战教程PDF完整全套教学课件
2024-04-08 19:57

第1章静态网页爬虫第2章常见反爬措施及解决方案第3章自己动手编写一个简单的第4章 Scrapy 架应用第5章爬虫数据分析及可视化
python爬虫错误 python
2023-04-13 22:55

回答 2 已采纳路径里面有冒号，而文件名不能有冒号。title替换下不允许使用的字符
解析Python网络爬虫：核心技术、Scrapy框架、分布式爬虫全套教学资料
2021-10-25 19:26

5. 错误处理与恢复：分布式系统需要考虑节点故障和数据一致性问题，确保爬虫在出现问题时能自我修复。四、教学资源本套教学资料包括教学大纲、课后习题答案、教学设计、教学PPT和源代码。这些资源将帮助学习者...
python爬虫从入门到精通（模块）
2023-03-17 18:50

这份文档旨在帮助想要学习Python爬虫的初学者，从入门到精通逐步提升自己的技能。以下是我们将要涵盖的主题： ## 入门篇 1. Python爬虫简介 2. Requests库的使用 3. Beautiful Soup库的使用 4. 爬虫实战：爬取百度...
没有解决我的问题, 去提问

悬赏问题

¥15 ansys fluent计算闪退
¥15 有关wireshark抓包的问题
¥15 需要写计算过程，不要写代码，求解答，数据都在图上
¥15 向数据表用newid方式插入GUID问题
¥15 multisim电路设计
¥20 用keil，写代码解决两个问题，用库函数
¥50 ID中开关量采样信号通道、以及程序流程的设计
¥15 U-Mamba/nnunetv2固定随机数种子
¥15 vba使用jmail发送邮件正文里面怎么加图片
¥15 vb6.0如何向数据库中添加自动生成的字段数据。

用python做爬虫出现错误如何调试

1条回答 默认 最新

悬赏问题

1条回答默认最新