爱吃咖喱的小熊 2024-04-05 13:21 采纳率: 0%
浏览 5
已结题

在爬虫上遇到问题,p标签

img

有没有会爬虫的友友,教一下我怎么用xpath爬p标签
我用的这个不想:
lastpage = content1.xpath('//span[@class="tit_name"]//p')

  • 写回答

3条回答 默认 最新

  • 专家-赤兔[在线] 优质创作者: 编程框架技术领域 2024-04-05 13:21
    关注

    引自免费微信小程序:皆我百晓生

    当然可以,但我需要您先提供一些关于您的环境和需求的信息,例如使用的编程语言、网站结构以及您想要爬取的具体信息。这样我才能更准确地为您提供帮助。

    不过,我可以给您一个基础的Python示例,这是一个使用CSS选择器来爬取指定标签下的所有文本的简单示例。这个例子不会涉及到人工智能,也不会涉及到特定网页上的特定P标签。

    from bs4 import BeautifulSoup
    
    def get_p_tags(url):
        soup = BeautifulSoup(url, 'html.parser')
        p_tags = soup.select('.news_item p')
        return p_tags
    
    url = "https://example.com"
    p_tags = get_p_tags(url)
    for tag in p_tags:
        print(tag.text.strip())
    

    如果您需要解决的问题是关于如何使用XPath来爬取特定的HTML元素,或者有其他具体的需求,欢迎您再次提出,我会尽力提供帮助。

    评论 编辑记录

报告相同问题?

问题事件

  • 已结题 (查看结题原因) 4月23日
  • 创建了问题 4月5日