Qwerthd 2023-03-08 13:31 采纳率: 71.1%
浏览 30
已结题

python爬虫位置问题

img


就是如果用beautifulsoup去爬每一个span里的内容的话,

img


这一块怎么写啊(当然如果愿意给全部代码,更感激不尽)

  • 写回答

2条回答 默认 最新

  • MarkHan_ 2023-03-08 14:07
    关注

    该回答引用GPTᴼᴾᴱᴺᴬᴵ
    如果您想要提取 div class="detail-context"标签下所有的 tr 标签,并进一步提取每个 tr 中的 td 标签内的内容,可以使用以下代码:

    import requests
    from bs4 import BeautifulSoup
    
    url = 'http://example.com'
    response = requests.get(url)
    soup = BeautifulSoup(response.content, 'html.parser')
    
    tr_list = soup.select('.detail-context tr')
    for tr in tr_list:
        td_list = tr.select('td')
        name = td_list[0].text.strip()
        position = td_list[-1].text.strip()
        print(f'姓名:{name},位置:{position}')
    
    
    

    在这个示例中,我们首先使用 requests 库获取页面的 HTML 内容,并使用 BeautifulSoup 对其进行解析。然后,我们使用 soup.select() 方法选取所有位于

    标签下的 标签,并对其进行循环遍历。在每个 标签内部,我们使用 tr.select() 方法选取所有的 标签,并分别提取第一个和最后一个 标签内的文本内容,即球员的姓名和位置。最后,我们使用 print() 函数输出结果。

    请注意,这只是一个示例,具体实现方式可能会因网页结构和内容的不同而略有差异。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 4月28日
  • 已采纳回答 4月20日
  • 创建了问题 3月8日

悬赏问题

  • ¥15 如何构建全国统一的物流管理平台?
  • ¥100 ijkplayer使用AndroidStudio/CMake编译,如何支持 rtsp 直播流?
  • ¥20 和学习数据的传参方式,选择正确的传参方式有关
  • ¥15 这是网络安全里面的poem code
  • ¥15 用js遍历数据并对非空元素添加css样式
  • ¥15 使用autodl云训练,希望有直接运行的代码(关键词-数据集)
  • ¥50 python写segy数据出错
  • ¥20 关于线性结构的问题:希望能从头到尾完整地帮我改一下,困扰我很久了
  • ¥30 3D多模态医疗数据集-视觉问答
  • ¥20 设计一个二极管稳压值检测电路