1,爬取
2,爬取下来有很多代码,只挑出那个大学排行榜表格
3,按照原有的表格样式将表格移入CSV文件中。网址http://www.gaosan.com/gaokao/311315.html
4目前我只学过beautifulsoup,requests, csv, os, 请只用这几个库解答,谢谢
爬虫爬取2022年高三网的大学排行榜并保存为CSV文件
- 写回答
- 好问题 0 提建议
- 关注问题
- 邀请回答
-
2条回答 默认 最新
关注from urllib.request import urlopen from bs4 import BeautifulSoup import csv req = urlopen('http://www.gaosan.com/gaokao/311315.html') con = req.read() bs = BeautifulSoup(con,features='html.parser') all_tr = bs.find('table').find_all('tr') all_td=[] for i in all_tr: all_td.append(i.find_all('td')) ranking=[] for i in all_td: ranking.append([i[0].text, i[1].text, i[2].text, i[3].text]) with open('ranking.csv','w', newline='') as f: writer = csv.writer(f) writer.writerows(ranking)本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 无用评论 打赏 举报