爬虫爬取tr中的td内容,我的代码之前可以爬另一个几乎一样的网页,不知道为什么这个就不行了
1条回答 默认 最新
- bingbingyihao 2023-03-08 12:13关注本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 无用评论 打赏 举报Qwerthd 2023-03-08 12:55
import requests
from bs4 import BeautifulSoupheaders = {
"user-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/107.0.0.0 Safari/537.36"
}
url = 'http://www.volleychina.org/chnwvt2015.htmll'
response = requests.get(url)
soup = BeautifulSoup(response.content, 'html.parser')tr_list = soup.select('.detail-context tr')
print(tr_list)
f = open('./女排名单/2015女排名单.txt', 'w+', encoding='utf-8')
for tr in tr_list:
td_list = tr.select('td')
# name = td_list[0].text.strip()
# birthtime=td_list[1].text.strip()
# height=td_list[2].text.strip()
# smash=td_list[4].text.strip()
# block=td_list[5].text.strip()
# position = td_list[6].text.strip()
# province=td_list[-1].text.strip()附代码的话会被判断成违规
赞回复展开全部6条评论
悬赏问题
- ¥15 爱快路由器端口更改错误导致无法访问
- ¥20 安装catkin时遇到了如下问题请问该如何解决呢
- ¥15 VAE模型如何输出结果
- ¥15 编译python程序为pyd文件报错:{"source code string cannot contain null bytes"
- ¥20 关于#r语言#的问题:广义加行模型拟合曲线后如何求拐点
- ¥15 fluent设置了自动保存后,会有几个时间点不保存
- ¥20 激光照射到四象线探测器,通过液晶屏显示X、Y值
- ¥50 数据库开发问题求解答
- ¥15 安装anaconda时报错
- ¥15 小程序有个导出到插件方式,我是在分包下引入的插件,这个export的路径对吗,我看官方文档上写的是相对路径