Qwerthd 2023-03-08 13:31 采纳率: 71.1%
浏览 30
已结题

python爬虫位置问题

img


就是如果用beautifulsoup去爬每一个span里的内容的话,

img


这一块怎么写啊(当然如果愿意给全部代码,更感激不尽)

  • 写回答

2条回答 默认 最新

  • MarkHan_ 2023-03-08 14:07
    关注

    该回答引用GPTᴼᴾᴱᴺᴬᴵ
    如果您想要提取 div class="detail-context"标签下所有的 tr 标签,并进一步提取每个 tr 中的 td 标签内的内容,可以使用以下代码:

    import requests
    from bs4 import BeautifulSoup
    
    url = 'http://example.com'
    response = requests.get(url)
    soup = BeautifulSoup(response.content, 'html.parser')
    
    tr_list = soup.select('.detail-context tr')
    for tr in tr_list:
        td_list = tr.select('td')
        name = td_list[0].text.strip()
        position = td_list[-1].text.strip()
        print(f'姓名:{name},位置:{position}')
    
    
    

    在这个示例中,我们首先使用 requests 库获取页面的 HTML 内容,并使用 BeautifulSoup 对其进行解析。然后,我们使用 soup.select() 方法选取所有位于

    标签下的 标签,并对其进行循环遍历。在每个 标签内部,我们使用 tr.select() 方法选取所有的 标签,并分别提取第一个和最后一个 标签内的文本内容,即球员的姓名和位置。最后,我们使用 print() 函数输出结果。

    请注意,这只是一个示例,具体实现方式可能会因网页结构和内容的不同而略有差异。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 4月28日
  • 已采纳回答 4月20日
  • 创建了问题 3月8日

悬赏问题

  • ¥15 有赏,i卡绘世画不出
  • ¥15 如何用stata画出文献中常见的安慰剂检验图
  • ¥15 c语言链表结构体数据插入
  • ¥40 使用MATLAB解答线性代数问题
  • ¥15 COCOS的问题COCOS的问题
  • ¥15 FPGA-SRIO初始化失败
  • ¥15 MapReduce实现倒排索引失败
  • ¥15 ZABBIX6.0L连接数据库报错,如何解决?(操作系统-centos)
  • ¥15 找一位技术过硬的游戏pj程序员
  • ¥15 matlab生成电测深三层曲线模型代码