Python爬虫数据，需要抓图和代码

问题遇到的现象和发生背景

问题相关代码，请勿粘贴截图

运行结果及报错内容

我的解答思路和尝试过的方法

我想要达到的结果第一题需要代码，第二题代码抓图都需要。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

溪风沐雪 2022-06-07 19:44

关注

from bs4 import BeautifulSoup
import pandas as pd
import requests
from urllib.request import urlopen

def getContent(url):
    myURL = urlopen(url)
    if myURL.getcode()==200:
        content = myURL.read()
    elif myURL.getcode()==418:     
        headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:23.0) Gecko/20100101 Firefox/23.0'}
        req = requests.get(url, headers=headers)
        content = req.text
    else:
        content = None
        print("爬取失败！")
        return None
    bsObj = BeautifulSoup(content, 'lxml')
    return bsObj

def getList(url):
    names = []
    authors = []
    prices = []
    bsobj = getContent(url)
    if bsobj:
        bs = bsobj.find_all('div', {'class': 'imgmain2_r floatleft_q'})
        for i in range(0, len(bs)):
            book_name = bs[i].find('p',{"style":"height:40px"}).find('a').text
            author = bs[i].find('p',{"style":"height:20px"}).text.split('\n')[1]
            price =  bs[i].find('p',{"class":"dj_r"}).text.split('：')[1]
            names.append(book_name)
            authors.append(author)
            prices.append(price)
    return names,authors,prices
url = 'http://www.cyp.com.cn/?action-model-name-specialbooksort-itemid-3.html'
names,authors,prices = getList(url)
bookInfos = pd.DataFrame({'书名': names, '作者': authors, '定价':prices})
bookInfos.to_csv('pachong_XYY.csv', encoding='gbk')

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(1条)

报告相同问题？

关注问题

2019Python爬虫超完整教程.rar
2020-09-01 18:21

Python爬虫是编程领域中一个热门的技术分支，主要用于自动化地从互联网上收集和处理数据。2019Python爬虫超完整教程包含了丰富的学习资源，包括教程、笔记和作业，旨在帮助初学者全面掌握Python爬虫技术。在这个教程...
python爬虫抓图_Python系列之五_爬虫抓图
2021-02-04 06:15

weixin_39946767的博客 Python系列之五_爬虫抓图前面我们粗略地学习了Python语言的语法，一直学语法也挺无聊的，现在让我们让做一些有趣的事情。例如你在百度贴吧里看到一篇文章，里面有很多好看的图片，但是一张张另存比较慢，学完Python...
7个入门级Python项目代码，练手必备
2022-07-12 11:15

程序员枸杞.的博客 3、很多人是用来抓图，数据，抓点图片、视频、天气预报自娱自乐一下，然后呢？抓到大数据以后做什么用呢？比如某某啤酒卖的快，然后呢？比如某某电影票房多，然后呢？无聊的时候，听两个聊天机器人互相聊天 ...
Python抓图必学的8种方式！
2021-02-20 16:55

python阿喵的博客通过用爬虫示例来说明并发相关的多线程、多进程、协程之间的执行效率对比。假设我们现在要在网上下载图片，一个简单的方法是用 requests+BeautifulSoup。注：本文所有例子都使用python3.5）单线程示例 1：...
python爬取图集以及无水印视频
2023-11-24 10:14

白帽黑客艾登的博客在去除水印时，需要根据水印的位置、大小和颜色等特征进行适当的调整和优化。当我学到一定基础，有自己的理解能力的时候，会去阅读一些前辈整理的书籍或者手写的笔记资料，这些笔记详细记载了他们对一些技术点的理解...
Python实操：如何利用Python爬取网上的图片
2024-02-08 18:45

人工智能杂谈的博客 Python作为一门功能丰富的编程语言，提供了许多方便的工具和库，使得网页内容的抓取和图片的下载变得非常容易。本文将介绍如何利用Python编写简单的爬虫程序，实现从网上抓取图片的功能，并提供相应的示例代码。以上...
这 7 个 Python 实战项目代码，让你分分钟晋级大神！
2024-07-13 16:24

宇宙大豹发的博客 3、很多人是用来抓图，数据，抓点图片、视频、天气预报自娱自乐一下，然后呢？抓到大数据以后做什么用呢？比如某某啤酒卖的快，然后呢？比如某某电影票房多，然后呢？1、抓取知乎图片2、听两个聊天机器人互相聊天3、...
Python系列之五_爬虫抓图
2017-03-04 07:09

hanhf的博客 Python系列之五_爬虫抓图
python网络爬虫最细致讲解之漫画抓取【细！！！】
2021-02-14 21:47

い风花の雪栎的博客本次以漫画抓取为例，来一步一步结合浏览器后台与爬虫编程讲解，也可以延伸到应对其他不同的网页抓取一、实现目的首先说明一下本次抓取的网站：XKCD，是一个流行的极客漫画网站。首页url：http://xkcd.com/ ...
爬虫数据采集基础
2022-06-28 23:20

m0_46427459的博客极简插件 fake_useragent模块爬虫通讯原理 HTTP 和 HTTPS 请求响应会话和Cookies 无状态HTTP socket介绍七层协议：流程图请求报文格式使用socket下载图片 httpx模块 httpx请求抓图案例数据采集HTTP库使用...
python微博爬虫实战_爬虫实战——四大指数之微博指数（一）
2021-02-04 01:00

High莹的博客 (本人原创，谢绝转载)最近，豇豆哥写了关于一...这里说明一下：在fiddler设置一下过滤条件，就能过滤掉无用杂乱的其他数据，剩下的数据就是你所需要的。我们访问iPhone的微指数抓图下来可以看到这些数据：然后返回fi...
7个Python实战项目代码，让你分分钟晋级大神！
2021-06-21 15:34

志在极限的博客关于Python有一句名言：...3、很多人是用来抓图，数据，抓点图片、视频、天气预报自娱自乐一下，然后呢？抓到大数据以后做什么用呢？比如某某啤酒卖的快，然后呢？比如某某电影票房多，然后呢？我认为用Python应...
python正则表达式初识_python爬虫之路——正则表达式初识
2020-12-03 11:54

weixin_39953845的博客 python中的re模块拥有全部的正则表达式功能. 判断字符: 类型: 数目:有无: 个数:单值区间离散判断一个字符: 表示一个字符:①确定 (1)字符 a,b,1,4 (2)转义字符 \. ②完全不确定 (.) 匹配任意单个字符,不包...
python 人工智能项目代码_7个Python实战项目代码，让你分分钟晋级大神！
2021-01-12 02:34

weixin_39635084的博客关于Python有一句名言：不要重复造轮子。但是问题有三个：1、你不知道已经有哪些轮子已经造好了，...3、很多人是用来抓图，数据，抓点图片、视频、天气预报自娱自乐一下，然后呢？抓到大数据以后做什么用呢？比如...
7个实用的Python自动化代码，别再重复造轮子了
2022-05-18 11:58

程序员枸杞.的博客 3、很多人是用来抓图，数据，抓点图片、视频、天气预报自娱自乐一下，然后呢？抓到大数据以后做什么用呢？比如某某啤酒卖得快，然后呢？比如某某电影票房多，然后呢？以下是经过Python3.6.4调试通过的代码
Python爬虫入门教程 67-100 Python爬虫摆脱控制台，开始走上台面
2020-03-25 22:28

梦想橡皮擦的博客对于一个程序猿来说，或者对于一个Python程序猿来说，你写的爬虫最后是一个python文件，传播起来毫无问题，但是你想让更多的人使用你的爬虫程序，让你的程序普适性更强，你就不能给用户一个Python文件，然后告诉他，...
爬虫抓图全网最新方法，这一次终于是4k高清美图，只因为我不下载JPG图片！
2020-05-08 09:02

沙漏在下雨的博客那我有一种另类方式可以帮助你真正的白嫖高质量图片，肝了一个礼拜的干货，绝对能改变你对爬虫的看法和思考，原来爬虫这么有趣，也不会这么思维固然，代码方式尽量简单一点，让大家能看懂，加油各位！
【短视频爬虫Python实战宝典】：从零掌握高效爬取抖音、快手视频的绝密技巧
2025-10-05 14:15

BytePulse的博客掌握短视频爬虫Python技巧，轻松高效抓取抖音、快手热门视频。详解逆向工程、接口分析与自动化下载方法，适用于内容采集、竞品分析等场景。稳定高效，适配主流平台，值得收藏实战指南。
python使用Flask框架实现疫情监控追踪可视化项目
2021-10-05 17:00

彭祥.的博客 编程语言：python 框架：flask 数据库：MySQL 开发环境: python3.7 pycharm 涉及知识：爬虫+ajax+echart+flask 首先给大家看一下最终效果：我们来梳理一下项目的流程：爬取各个网站平台的数据将所得数据进行...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 6月16日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 6月8日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 6月7日

Python爬虫数据，需要抓图和代码

问题遇到的现象和发生背景

问题相关代码，请勿粘贴截图

运行结果及报错内容

我的解答思路和尝试过的方法

我想要达到的结果 第一题需要代码，第二题代码抓图都需要。

2条回答 默认 最新

问题事件

我想要达到的结果第一题需要代码，第二题代码抓图都需要。

2条回答默认最新