十十央. 2023-11-30 19:01 采纳率: 88.9%
浏览 25
已结题

如何爬取没有class标签中的文本

img


爬取网页数据,a标签中没有class怎么获取其中的文本内容,,

  • 写回答

2条回答 默认 最新

  • CSDN-Ada助手 CSDN-AI 官方账号 2023-11-30 20:56
    关注

    【以下回答由 GPT 生成】

    解决方案:

    你可以使用BeautifulSoup库中的find_all方法来获取HTML页面中的所有a标签,然后使用.text属性获取其中的文本内容。

    以下是修改后的代码:

    import requests
    from bs4 import BeautifulSoup
    
    url = 'your_website_url'
    response = requests.get(url)
    html_data = response.text
    soup = BeautifulSoup(html_data, 'html.parser')
    a_tags = soup.find_all('a')  # 获取所有a标签
    for tag in a_tags:
        text = tag.text  # 获取文本内容
        print(text)  # 打印文本内容
    

    上述代码会获取到网页中所有a标签的文本内容,并且通过print语句将其打印出来。

    请将 'your_website_url' 替换为你要爬取的网址。

    希望对你有帮助!如果有任何问题,请随时提问。



    【相关推荐】



    如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 已结题 (查看结题原因) 12月3日
  • 已采纳回答 12月3日
  • 创建了问题 11月30日