Qwerthd 2023-03-08 12:02 采纳率: 71.1%
浏览 48
已结题

关于#爬虫#的问题:爬虫爬取tr中的td内容,我的代码之前可以爬另一个几乎一样的网页(语言-python)

爬虫爬取tr中的td内容,我的代码之前可以爬另一个几乎一样的网页,不知道为什么这个就不行了

img

  • 写回答

1条回答 默认 最新

  • bingbingyihao 2023-03-08 12:13
    关注

    回答:你可以把你的脚本贴一下,这个网页结构还是比较清晰的,可以用beautifulsoup比较容易获取到内容

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
    Qwerthd 2023-03-08 12:55

    import requests
    from bs4 import BeautifulSoup

    headers = {
    "user-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/107.0.0.0 Safari/537.36"
    }
    url = 'http://www.volleychina.org/chnwvt2015.htmll'
    response = requests.get(url)
    soup = BeautifulSoup(response.content, 'html.parser')

    tr_list = soup.select('.detail-context tr')
    print(tr_list)
    f = open('./女排名单/2015女排名单.txt', 'w+', encoding='utf-8')
    for tr in tr_list:
    td_list = tr.select('td')
    # name = td_list[0].text.strip()
    # birthtime=td_list[1].text.strip()
    # height=td_list[2].text.strip()
    # smash=td_list[4].text.strip()
    # block=td_list[5].text.strip()
    # position = td_list[6].text.strip()
    # province=td_list[-1].text.strip()

    附代码的话会被判断成违规

    回复
    bingbingyihao 回复 Qwerthd 2023-03-08 13:15

    回答:得嘞,这个网站地址有误,打不开的,爬取不到内容

    回复
    Qwerthd 回复 bingbingyihao 2023-03-08 13:31

    等会,网址错了,html后面多了一个l。我靠,也算是你帮忙了

    回复
    展开全部6条评论
编辑
预览

报告相同问题?

问题事件

  • 系统已结题 3月15日
  • 已采纳回答 3月8日
  • 创建了问题 3月8日

悬赏问题

  • ¥15 爱快路由器端口更改错误导致无法访问
  • ¥20 安装catkin时遇到了如下问题请问该如何解决呢
  • ¥15 VAE模型如何输出结果
  • ¥15 编译python程序为pyd文件报错:{"source code string cannot contain null bytes"
  • ¥20 关于#r语言#的问题:广义加行模型拟合曲线后如何求拐点
  • ¥15 fluent设置了自动保存后,会有几个时间点不保存
  • ¥20 激光照射到四象线探测器,通过液晶屏显示X、Y值
  • ¥50 数据库开发问题求解答
  • ¥15 安装anaconda时报错
  • ¥15 小程序有个导出到插件方式,我是在分包下引入的插件,这个export的路径对吗,我看官方文档上写的是相对路径
手机看
程序员都在用的中文IT技术交流社区

程序员都在用的中文IT技术交流社区

专业的中文 IT 技术社区,与千万技术人共成长

专业的中文 IT 技术社区,与千万技术人共成长

关注【CSDN】视频号,行业资讯、技术分享精彩不断,直播好礼送不停!

关注【CSDN】视频号,行业资讯、技术分享精彩不断,直播好礼送不停!

客服 返回
顶部