Qwerthd 2023-03-08 13:31 采纳率: 71.1%
浏览 30
已结题

python爬虫位置问题

img


就是如果用beautifulsoup去爬每一个span里的内容的话,

img


这一块怎么写啊(当然如果愿意给全部代码,更感激不尽)

  • 写回答

2条回答 默认 最新

  • MarkHan_ 2023-03-08 14:07
    关注

    该回答引用GPTᴼᴾᴱᴺᴬᴵ
    如果您想要提取 div class="detail-context"标签下所有的 tr 标签,并进一步提取每个 tr 中的 td 标签内的内容,可以使用以下代码:

    import requests
    from bs4 import BeautifulSoup
    
    url = 'http://example.com'
    response = requests.get(url)
    soup = BeautifulSoup(response.content, 'html.parser')
    
    tr_list = soup.select('.detail-context tr')
    for tr in tr_list:
        td_list = tr.select('td')
        name = td_list[0].text.strip()
        position = td_list[-1].text.strip()
        print(f'姓名:{name},位置:{position}')
    
    
    

    在这个示例中,我们首先使用 requests 库获取页面的 HTML 内容,并使用 BeautifulSoup 对其进行解析。然后,我们使用 soup.select() 方法选取所有位于

    标签下的 标签,并对其进行循环遍历。在每个 标签内部,我们使用 tr.select() 方法选取所有的 标签,并分别提取第一个和最后一个 标签内的文本内容,即球员的姓名和位置。最后,我们使用 print() 函数输出结果。

    请注意,这只是一个示例,具体实现方式可能会因网页结构和内容的不同而略有差异。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 4月28日
  • 已采纳回答 4月20日
  • 创建了问题 3月8日

悬赏问题

  • ¥15 nslt的可用模型,或者其他可以进行推理的现有模型
  • ¥15 arduino上连sim900a实现连接mqtt服务器
  • ¥15 vncviewer7.0安装后如何正确注册License许可证,激活使用
  • ¥15 phython如何实现以下功能?查找同一用户名的消费金额合并2
  • ¥66 关于人体营养与饮食规划的线性规划模型
  • ¥15 基于深度学习的快递面单识别系统
  • ¥15 Multisim仿真设计地铁到站提醒电路
  • ¥15 怎么用一个500W电源给5台60W的电脑供电
  • ¥15 请推荐一个轻量级规则引擎,配合流程引擎使用,规则引擎负责判断出符合规则的流程引擎模板id
  • ¥15 Excel表只有年月怎么计算年龄