怎么爬取一个网页某个div 的class里的所有链接

使用 Python 的 requests 和 BeautifulSoup 库进行操作，怎么爬取一个网页某个div 的class里的所有链接？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN-Ada助手 CSDN-AI 官方账号 2023-06-21 20:31
关注
建议你看下这篇博客👉 ：python中用requests库和BeautifulSoup库爬的大学排名
除此之外, 这篇博客: Python下基于requests及BeautifulSoup构建网络爬虫中的案例部分也许能够解决你的问题, 你可以仔细阅读以下内容或跳转源博客中阅读:
假设我要http://maoyan.com/board/4猫眼电影的top100电影的相关信息，如下截图：

获取电影的标题及url。

您还可以看一下郭宏志老师的Python爬虫实战（Requests+BeautifulSoup版）课程中的课程简介小节, 巩固相关知识点
以下回答由chatgpt基于相关博客总结生成:
我可以根据参考资料中的代码，结合问题中给出的具体信息来解决问题。假设要爬取的网页URL为'https://example.com'，要抓取的div元素的class为'link-div'，需要抓取所有链接的绝对链接。

首先导入需要用到的库：

import requests from bs4 import BeautifulSoup

定义一个函数get_links()，用来获取所有链接

def get_links(url): response = requests.get(url) soup = BeautifulSoup(response.content, 'html.parser') divs = soup.find_all('div', {'class': 'link-div'}) links = [] for div in divs: for a in div.find_all('a'): link = a.get('href') if link.startswith('http'): links.append(link) else: links.append(url+link) return links

这个函数首先发送GET请求获取网页内容，然后使用BeautifulSoup解析网页内容。接着查找所有class为'link-div'的div元素，再在这些div元素中查找所有a标签，最后将a标签中href属性开头为'http'的绝对链接和其他相对链接拼接成绝对链接后存储到列表中。

调用get_links()函数获取所有链接

all_links = get_links('https://example.com')

这样就可以获取到所有链接了，可以进一步处理或者直接输出。

如果要进一步提取链接对应的页面内容，可以在for循环中使用requests.get()请求链接并用BeautifulSoup解析内容，然后进行相应的数据抓取和处理。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Python爬取京东的商品分类与链接
2020-09-21 13:48

本文将详细介绍如何使用Python爬取京东的商品分类及其对应的链接，这对于刚接触爬虫的新手来说是一个很好的入门实践。 #### 技术栈本教程主要涉及的技术包括： - **Python**: 当今最流行的编程语言之一，以其...
第一个 Python 爬虫实战：爬取静态网页文本内容
2025-10-29 23:24

python 爬虫工程师的博客本文介绍了使用Python进行静态网页爬取的基础技术，重点讲解了requests和BeautifulSoup两个核心库的使用方法。文章以豆瓣读书Top250为例，详细展示了发送GET请求、解析HTML结构、提取关键信息（标题、链接、图片地址...
一个爬取百度搜索结果的爬虫
2023-12-29 21:49

标题 "一个爬取百度搜索结果的爬虫" 暗示了我们要讨论的是关于使用Python进行网络爬虫，特别是针对百度搜索引擎的爬取技术。在Python中，爬虫是通过编写特定的代码来自动化地抓取网页信息的一种方法。在这个案例中，...
AI网络爬虫022：批量下载某个网页中的全部链接
2024-07-11 07:48

翰墨之道的博客产品优势 AI网络爬虫022：批量下载某个网页中的全部链接
Python爬虫开发：爬取简单的网页数据
2024-08-13 22:07

做梦都在改BUG的博客本文详细介绍了如何使用Python爬取简单的网页数据，以掘金为例，展示了从发送HTTP请求、解析HTML文档到提取和保存数据的完整过程。通过这个示例，你可以掌握基本的网页爬取技巧，为后续的数据分析打下基础。
第5关：爬取单页多个div标签的信息
2022-11-04 10:19

小锐->技术成就梦想,梦想成就辉煌。的博客 find_all函数通过BeautifulSoup的find_all(name，attr)方法，可以找到符合条件的多个标签，将多个标签的内容返回为一个列表。爬取湖南大学讲座网页的多个讲座信息，存储在二维列表jzxx中。根据提示，在右侧编辑器...
入门级教程：手把手带你学会用Python爬取网页数据！
2024-09-05 13:35

豆本-豆豆奶的博客我们先来看一个简单的Pvthon爬虫程序，爬取一个网页的标题：在这个程序中，我们使用了requests库来发送HTTP请求，并使用BeautifulSoup库来解桥HTML文档。通过这两个库，我们可以轻松地获取网页数据进而进行数据分析...
Python爬虫练习笔记——爬取单个网页里的所有图片（入门）
2020-04-14 17:45

高大宝呀的博客先从简单的练习开始吧~ 爬取单个网页里的所有图片，这个没有什么难点，因为不需要翻页哈哈哈哈我很喜欢一些文章中的配图，比如这篇，里面就会有很多电影中的经典截图第一步：分析网页 1.首先我们要了解要爬取网站...
利用img请求一个html页面,爬虫学习笔记——爬取单个网页里的所有图片（入门）...
2021-06-12 03:33

weixin_39779528的博客最近闲着，想学一下爬虫 (＾－＾)V ——[手动比耶]先从简单的练习开始吧~ 爬取单个网页里的所有图片，这个没有什么难点，因为不需要翻页哈哈哈哈。我很喜欢一些文章中的配图，比如这篇，里面就会有很多电影中的经典...
用python抓取一个网页的xhr,python爬取网站数据代码
2024-05-28 11:10

2401_85306094的博客大家好，本文将围绕用python抓取网页数据的代码展开说明，python爬虫技术抓取网站数据是一个很多人都想弄明白的事情，想搞清楚python抓取网页内容并保存需要先了解以下几个事情。随着网络的普及和信息爆炸式增长，...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 6月21日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 6月21日

怎么爬取一个网页某个div 的class里的所有链接

1条回答 默认 最新

问题事件

1条回答默认最新