pandas数据分析处理

3.7：某店铺化妆品销售情况记录表

题目描述

下方提供的是各商品在某时间段的销售数据，某运营想对其进行数据分析，请编写程序完成以下任务。

对pro_sale_data数据表进行清洗

 a. 删除重复数据 (删除重复行)

 b.缺失数据处理 (将缺失值填充为0)

检索 title 字段中含有字符串 keyword 的产品数量 (去重后)。每个 id 表示一个产品
给定品牌名称 brand_name，统计该品牌销售额前 5名产品的总销售额
使用 jieba 分词，查询出现次数为 num 的标题(产品名称)中所有词汇的数量

程序提供字符串 keyword，产品名称 brand_name 和 num，需要返回 title 字中含有 keyword 关键词产品数量brand_name 产品下销售额前 5 的产品的总销售额和出现次数为 num 的所有词汇的词汇数量.

销售额 = sale_count(销售数量)* price(单价)

题目要求

程序不接收参数 keyword 数据类型是 str，brand_name 数据类型是 str，num 数据类型是 int:2,产品需要返回产品数量数据类型是 int，总销售额数据类型是 float，词汇数量的数据类型是 int;
返回结果需要包事在元组 tuple 中;
如果产品中不含有关键词 keyword，需要返回 0:
给定 brand_name 一定出现在数据中:
如果对应 num 没有对应的词汇，需要返回 0。
测试用例
输入: keyword="光采”,brand_name="兰芝",num=3

输出:(20,1453666365.0,53)

解释:含有'光采' 关键词的产品数量是 20，’兰芝” 产品排行前5产品总销售额是1453666365.0，分词词频为 3的关键词数量是53个

输入: keyword="洗发"，brand_name="佰草集"，num=7

输出: (33,1560362304.0,172)

解释:含有“洗发关键词的产品数量是 33，’相宜本草” 产品排行前 5产品总销售额是 1560362304.0，分词词频为 7 的关键词数量是 172 个

输入: keyword="冰爽"，brand_name="兰蔻",num=401

输出:(5,693332000.0,2)

数据说明

pro_sale data: 该数据为销售数据;编码格式为 gbk’ ;总共有27599行、7列;字段含义如下:

字段	含义	解释
update_time	统计时间	-
id	产品编号	一个产品具有一个id
title	产品名称	-
price	交易价格	产品的价格
sale_count	销量	-
comment_count	评论数量	-
brand_name	品牌名称	-

文件在GitHub上：https://github.com/mcyt1/pandas-

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

报告相同问题？

关注问题

B站 Python Pandas 数据分析，编程练习100例
2022-02-25 16:09

在"B站 Python Pandas 数据分析，编程练习100例"这个主题中，我们主要探讨的是如何使用Python的Pandas库进行数据处理和分析。Pandas是Python中一个强大的数据分析工具，它提供了丰富的数据结构（如DataFrame和Series...
基于Python和HTML的pandas数据处理与分析设计源码
2025-02-13 06:41

本项目提供了一个基于Python和HTML的pandas数据处理与分析设计源码，它是一个集成了多种文件类型和编程语言的综合性工具，旨在帮助用户进行高效的数据分析和可视化。首先，Python是当今最流行的数据处理语言之一，...
Pandas数据分析代码
2024-04-25 20:24

在数据分析领域，Pandas是一个不可或缺的工具，它为Python编程语言提供了高效的数据处理能力。Pandas库基于NumPy构建，旨在简化数据清洗、转换、整合和分析等任务。本资料包“Pandas数据分析代码”主要涵盖了使用...
Python数据分析基础：Pandas数据处理10个技巧.pdf
2025-04-16 10:24

它作为当今最热门的编程语言，以简洁优雅的语法和强大的功能，深受全球开发者喜爱。该文档为你开启一段精彩的 Python 学习之旅。从基础语法的细致讲解，到实用项目的实战演练，逐步提升你的编程能力。无论是数据科学...
pandas库专为Python编程语言设计的强大的数据处理和分析库介绍文档
2024-07-02 12:36

### pandas库专为Python编程语言设计的强大的数据处理和分析库介绍 #### 一、概述 pandas 是一个为 Python 编程语言设计的强大且灵活的数据处理与分析库。它建立在 NumPy 之上，利用 NumPy 的强大计算能力来提供...
python数据分析pandas快速入门教程.pdf
2020-06-05 15:55

这部分主要概括了该教程的主题内容，即涉及的三个主要知识点：python编程语言，pandas数据处理库以及数据分析。而从提供的部分内容来看，知识点包含但不限于以下几点： 1. Pandas库的介绍：Pandas是一个开源的...
数据分析处理库-Pandas.zip
2021-06-24 09:37

Pandas是Python编程语言中一个强大的数据处理和分析库，被广泛应用于数据清洗、数据预处理、统计分析以及数据可视化等多个领域。它以其易用性、高效性和灵活性著称，深受数据科学家和分析师的喜爱。首先，Pandas的...
Python进阶-Pandas数据分析库
2021-06-11 14:50

Pandas是python中非常常用的数据分析库，在数据分析，机器学习，深度学习等领域经常被使用。本课程会讲解到pandas中最核心的一些知识点，包括Series以及DataFrame的构建，赋值，操作，选择数据，合并等等，以及使用...
Pandas数据分析笔记
2018-01-23 18:10

Pandas是Python编程语言中一个强大的数据处理库，它为数据分析提供了高效、灵活且易于使用的工具。本笔记旨在帮助初学者快速掌握Pandas的基础知识和核心功能，通过12个部分逐步深入，使你能够熟练地进行数据清洗、...
深入浅出Pandas：利用Python进行数据处理与分析 (李庆辉)
2024-11-01 13:02

第二部分（第3～5章）则专注于Pandas数据分析基础，为读者提供了分析数据所需的基础知识。书中涉及的内容还包括数据清洗、数据转换、数据合并与重塑、数据分组与聚合等数据处理的关键步骤和方法，最后还讨论了Pandas...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 11月24日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 11月16日

pandas数据分析处理

3.7：某店铺化妆品销售情况记录表

题目描述

题目要求

测试用例

数据说明

0条回答 默认 最新

问题事件

0条回答默认最新