Python爬虫抓取信息存储到excel表格后，怎么实行数据可视化

我用python爬去了起点中文网的一些信息，并且存储到excel中，现在想要实现数据可视化怎么写应该
import requests
from lxml import etree
from openpyxl import Workbook

class Book():
def init(p):
p.url = 'https://www.qidian.com/rank/hotsales?page={页数}'
p.wb = Workbook() # class实例化
p.ws = p.wb.active # 激活工具表
p.ws.append(['书名', '作者', '类型', '连载状态']) # 添加对应的表头

def geturl(p):
    url = [p.url.format(页数 =i) for i in range(1,15)]
    return url
def parse_url(p,url):
    response =requests.get(url,timeout = 5)
    return response.content.decode('utf-8','ignore')
def get_list(p,html_str):
    html = etree.HTML(html_str)
    connect_list = []
    lists = html.xpath("//div[@class='book-img-text']/ul/li//div[@class='book-mid-info']")
    for list in lists:
        item = {}
        item['书名'] = ''.join(list.xpath("./h4/a/text()"))
        item['作者'] = ''.join(list.xpath("./p[@class='author']/a[1]/text()"))
        item['类型'] = ''.join(list.xpath("./p[@class='author']/a[2]/text()"))
        item['连载状态'] = ''.join(list.xpath("./p[@class='author']/span/text()"))
        connect_list.append(item)
    return connect_list
def save_list(p, connects):
    for connect in connects:
        p.ws.append([connect['书名'], connect['作者'], connect['类型'], connect['连载状态']])
    print('保存小说信息成功')
def run(p):
    url_list = p.geturl()
    for url in url_list:
        html_url =p.parse_url(url)
        connects = p.get_list(html_url)
        p.save_list(connects[:])
    p.wb.save('book.xlsx')

if name=='__main__':
spider = Book()
spider.run()

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
迷茫猿小明 2020-01-03 19:04
关注
excel图表。或者另存为csv，用pandas和plot，生成饼图，直方图，散点图等等

解决 3

无用 1
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

用Python进行Excel表格数据的可视化处理 python
2022-04-08 21:49

回答 1 已采纳用pandas处理，按居住国分组，再累加财富就可以了
Pandas借助Python爬虫爬取HTML网页表格保存到Excel文件的问题，解答。 python 有问必答
2021-09-20 23:00

回答 2 已采纳没有指定打开方式写为with open("./Gldjc_Pandas.txt","w+") as fin:即可有帮助望采纳~
python 字典数据那么写入到excel中 python
2022-04-20 14:56

回答 1 已采纳用csv库，方法是writerow（）望采纳！
Python爬虫以及数据可视化分析
2020-12-25 17:43

反卷三明治的博客 Python爬虫以及数据可视化分析之B站动漫排行榜信息爬取分析简书地址：https://www.jianshu.com/u/40ac87350697 简单几步，通过Python对B站番剧排行数据进行爬取，并进行可视化分析源码文件可以参考Github上传的...
爬取网页表格数据到excel后，excel上没有数据？ python
2023-04-10 02:32

回答 4 已采纳结论：1、你的url是错误的。至少格式上来就错了。（https://liansai.500.com/zuqiu-6296/jifen-17831/2023-04-10&page=1）；2、col2之后
Python数据分析与可视化实践 python 数据分析
2021-11-02 21:07

回答 1 已采纳 import numpy as np z＝np.ones((9，),dtype="int64") Z=z.reshape(3,3) Z[2][3]＝1 如果报错，可能我的是中文输入的。请改成英文。手
利用python自动爬取网页相关信息并输出到excel表格里 list python
2022-08-03 18:00

回答 5 已采纳设计流程读取Excel中的事件编号需要的知识：使用 Python 读取Excel中的数据输入事件编号到网页端需要的知识：1.使用 Python 发送网络请求。首先需要分析目标网页输入事件编号这
Python电影爬虫，用Excel存储并进行数据可视化分析
2022-06-22 21:41

He.ZaoCha的博客先查看网页中的数据是属于哪种类型，例如：text、json等。由图中可以发现这边的数据是 json 类型的然后我们分析各排行榜中的url有何不同：这边我列举了3个排行榜的url出来，观察很容易发现其中的对应关系是一种...
python数据可视化 python 有问必答
2021-06-21 21:45

回答 2 已采纳这样写： import matplotlib.pyplot as plt import pandas as pd import numpy as np import seaborn as sns
关于Python 网络数据爬虫爬取不到数据 python
2020-06-01 15:18

回答 1 已采纳抓包看看，尤其注意url上的参数、cookie、postdata、method(get/post)、referer、useragent和content-type
python数据分析可视化 python 数据分析数据挖掘
2023-03-30 14:43

回答 1 已采纳帮你找了个相似的问题, 你可以看下: https://ask.csdn.net/questions/7462527这篇博客也不错, 你可以看下python两个表格数据核对，并把正确，错误，缺少的数据用
python把爬虫内容导出为excel_python制作爬虫并将抓取结果保存到excel中
2020-11-30 11:10

weixin_39695954的博客学习Python也有一段时间了，各种理论知识大体上也算略知一二了，今天就进入实战演练：通过Python来编写一个拉勾网薪资调查的小爬虫。第一步：分析网站的请求过程我们在查看拉勾网上的招聘信息的时候，搜索Python，...
python 爬虫，如何爬取相关数据 python 有问必答爬虫
2021-11-11 11:15

回答 1 已采纳先确定需要爬取的网站，然后分析网站的数据来源，是后端生成数据还是ajax生成数据，确定数据来源方式就根据HTTP请求编写代码，这个涉及一些请求参数的加密、转换等等处理，然后清洗数据和数据入库
Python爬虫及数据可视化网页实现
2021-11-04 10:38

FILW1024的博客目录前言一、爬虫部分（1）基本思路（2）库的使用二、数据库部分三、Flask框架部分 ...四、数据可视化部分 ...[Python爬虫编程基础5天速成（2021全新合集）Python入门+数据分析] 学前基础： ...
我是如何把python爬虫获取到的数据写入Excel的？
2021-08-18 08:57

途途途途的博客如何将爬虫获取的数据写入Excel，这一点我在爬虫文章几乎都是采用这种方式来进行操作的写入Excel的目的是为了后续更加方便的使用pandas对数据进行清洗、筛选、过滤等操作。为进一步数据研究、可视化打基础。 ...
没有解决我的问题, 去提问

悬赏问题

¥15 DIFY API Endpoint 问题。
¥20 sub地址DHCP问题
¥15 delta降尺度计算的一些细节，有偿
¥15 Arduino红外遥控代码有问题
¥15 数值计算离散正交多项式
¥30 数值计算均差系数编程
¥15 redis-full-check比较两个集群的数据出错
¥15 Matlab编程问题
¥15 训练的多模态特征融合模型准确度很低怎么办
¥15 kylin启动报错log4j类冲突

Python爬虫抓取信息存储到excel表格后，怎么实行数据可视化

2条回答 默认 最新

悬赏问题

2条回答默认最新