requests抓取html, 为什么div中的内容没有被抓取

老哥们，新人入坑，在用requests抓取页面中的图片，主要是想批量下载练练手，下面这张是页面源码：

但是我爬取完之后显示id为“cp_img”的div标签内的内容为：

以下是我的测试代码，主要是想抓到那个id为cp_img的div里面的内容：

import requests as rq
from bs4 import BeautifulSoup as bf

if __name__ == "__main__":
    url = 'http://www.1kkk.com/ch66-570484-p2/'
    myheaders = {
        'User-Agent':'Mozilla/5.0',
        'Referer':'http://www.1kkk.com/ch66-570484-p2/'
    }
    res = rq.get(url=url,headers=myheaders)
    res.encoding = 'utf-8'
    con = res.text
    bf1 = bf(con,'lxml')
    with open('file.html','w') as fp:
        fp.write(bf1.prettify())
        fp.close
    imgs = bf1.find_all('div',id='cp_img')
    print(imgs)

也查了很多，有说div折叠的，有说动态加载的，但是当时我用chrome抓到的包里也没有目的图片啊

求解

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN专家-黄老师 2021-04-28 20:34
关注
imgs = bf1.find_all('div',id='cp_img').get_text()，还要调用get_text()这个方法获取，find_all只是找到这个标签对象。

如果觉得有帮忙，望采纳

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(3条)

报告相同问题？

关注问题

Python使用lxml模块和Requests模块抓取HTML页面的教程
2020-09-21 16:24

例如，在本教程中使用的XPath表达式`//div[@title="buyer-name"]/text()`表示查找所有`title`属性值为`buyer-name`的`<div>`标签，并获取它们的文本内容。 #### 实际应用 1. **数据提取**：通过这种方式，我们可以...
使用Beautiful soup 对象中的方法实现对网页内容的抓取
2024-12-08 11:08

2301_81121233的博客如果网页内容是通过JavaScript动态加载的，单纯使用`requests`和`BeautifulSoup`可能无法抓取到这些内容。结合`requests`库，你可以首先使用`requests`获取网页内容，然后使用`BeautifulSoup`解析和抓取其中的数据。...
div区域内容抓取_Python爬虫实践(7)--抓取菜鸟教程python学习路线
2020-12-28 11:26

weixin_39894473的博客本期为python爬虫实践的第七节，传送门：Python爬虫实践(1)--大数据时代的数据挑战Python爬虫实践(2)--非结构化数据与爬虫Python爬虫实践(3)--了解网络爬虫背后的秘密Python爬虫实践(4)--编写第一个网络爬虫程序...
编写一个爬虫来抓取网站上的事实文章，如何实现？
2024-02-10 13:41

假设每篇新闻文章都被包含在一个`<div>`标签中，并且该`<div>`具有类名为`article`。使用`find_all()`方法可以找出所有符合条件的元素。 5. **提取文章标题和内容**： ```python for article in articles: ...
Python 爬虫教程：使用 BeautifulSoup 和 requests 从新闻网站抓取文章内容
2025-04-04 11:53

Python爬虫项目的博客爬虫反制措施：在实际应用中，很多网站会使用反爬虫技术限制自动化抓取。Python 爬虫的核心工作原理基于 HTTP 协议，首先需要向目标网站发送 HTTP 请求，然后解析返回的 HTML 内容，从中提取有用数据。HTTP 请求可以...
HTML网页内容抓取技术详解与实践
2025-06-25 05:21

深刻如此的博客网络爬虫，也被称作网络蜘蛛或网络机器人，是一种自动化程序，其主要目的是遍历互联网并收集数据。在网络爬虫的世界里，数据可以从各种网页上被抽取出来，用于搜索引擎优化、市场数据分析、新闻聚合等多种用途。网络...
网络爬虫：使用 requests抓取静态网页数据
2023-12-26 15:25

我爱吃非常荷包蛋的博客总之，使用requests库进行静态网页抓取需要发送HTTP请求、处理响应内容和解析网页内容。在编写爬虫时，要遵循法律法规和网站的规定，并注意保持良好的道德和法律素养。
Python 爬虫实战：如何使用 Python 抓取特定的 HTML 元素
2025-01-18 21:47

Python爬虫项目的博客本文详细介绍了如何使用Python抓取网页中的特定HTML元素。通过。
【爬虫】requests 结合 BeautifulSoup抓取网页数据
2024-06-14 17:12

顽石九变的博客 BeautifulSoup 是一个用于从 HTML 或 XML 文件中提取数据的 Python 库。结合requests轻松实现网页数据抓取，并以json形式存储。使用 pandas 和 matplotlib 库将抓取到的数据可视化。
没有解决我的问题, 去提问

requests抓取html, 为什么div中的内容没有被抓取

4条回答 默认 最新

4条回答默认最新