python/pandas 计算数值信息熵值

想计算信息熵值，结果 output的是 nan
问题准备：
图为sheet_new dataframe 格式

举例：
若某甲仅在一家药店留有购药记录，其信息熵值为0，因其p=1。
若某甲在不同药店的购药金额为[10,30,60]，其信息熵值为
'''-(0.1 * np.log2(0.1) + 0.3 * np.log2(0.3) + 0.6 * np.log2(0.6))'''，即1.295461844238322。

思路：

#想计算每一个 Buyer 的信息熵值
#想定义 信息熵值
def infor(sheet_new):
    a = sheet_new.values / 100
    return sum(np.log2(a) * a * (-1))

#尝试计算BID0001 的信息熵值
print(infor(sheet_new.BID0001))
#输出结果为   nan 并有警告 但没报错

可能我的思路有误
希望大家帮忙解答
谢谢！

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
不想秃头的夜猫子 2023-01-05 23:32
关注
所谓信息熵描述了信息源各可能事件发生的不确定性。试想若某人仅在一家药店购药，则他的行为是确定的；而若在多家药店购药，则存在一定的不确定性，需要通过博主上面给出的公式计算。以上就是对这道题的理解。

解题思路：
首先，判断每一个buyer（BID00i）是否在一家药店购药，也就是是判断每一列的非零值是否不唯一；
第二，若buyer仅在一家药店购药，则范围信息熵值为0；
第三，若buyer在多家药店购药，则按上述公式计算。给一个简单的编程思路：首先循环遍历每列，把非零值找出来，代入np.log2(a) * a * (-1)计算，然后将本列所有计算好的值求sum，即为该列对应的buyer的信息熵值。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

熵值法python代码
2024-10-07 23:37

将熵值法应用于Python，可以通过编写脚本来自动化处理数据，提取信息熵，计算指标权重，最后给出评价结果。为了实现这一过程，Python代码将首先需要导入相关的数据处理库，如Pandas用于数据的读取、处理，NumPy...
python计算信息熵、信息增益和信息增益率
2020-04-04 22:13

一只不爱晒太阳的猫的博客在这里，我将用python代码计算信息熵、信息增益和信息增益率。以下代码基于python、numpy和pandas。实现上述计算的代码一共11行。
熵权法原理&应用&python.zip
2024-02-04 20:05

Python作为强大的编程语言，提供了丰富的库和工具，可以帮助我们实现熵权法的计算。例如，可以使用numpy进行数值计算，pandas进行数据处理，matplotlib进行数据可视化。具体实现时，可以编写函数来计算熵值、信息...
不确定性计算python实验代码
2022-05-27 19:49

依赖度可以使用信息熵、互信息或其他相关度量来计算。属性约简的目标是找到最小的属性子集，该子集仍然能保留原始数据集中的大部分信息和依赖关系。 4. **模糊动态聚类**：模糊聚类是一种不同于传统 crisp 聚类（如...
Python Pandas 数据离散化：cut_qcut 方法对比
2025-06-05 20:00

AI Python 编程的博客 Pandas作为Python数据处理的核心库，提供了cut与qcut两种主流离散化方法，二者在分箱逻辑、适用场景与工程实践中存在显著差异。本文从第一性原理出发，系统对比两种方法的理论基础、实现机制与应用场景，结合数学...
基于Python和MATLAB的IGG-Hydrate THMC计算模块设计源码
2024-09-26 00:54

该项目利用Python作为主要开发语言，利用其简洁明了、易于学习的特点，结合MATLAB强大的数值计算和图形处理能力，构建了一个包含385个Python源文件和10个MATLAB脚本的大型计算模块。此外，项目还涉及了35个PNG格式的...
python pandas dataframe 列转换为离散值
2021-12-29 14:27

夏华东的博客的博客 python pandas dataframe 列转换为离散值 import pandas as pd import numpy as np df1 = pd.DataFrame( { '日期': ['2021-7-2', '2021-8-2', '2021-9-2', '2021-10-2'], 'A': [1, 2, 3, 4], 'B': [5, 6, 7, 8...
一维熵二维熵局部熵的Python实现.zip
2024-02-04 20:12

总的来说，熵权法是一种基于信息熵理论的权重计算方法，通过Python实现一维熵、二维熵和局部熵，可以帮助我们理解和评估系统的不确定性和复杂性。结合实际问题，如数据分析、决策支持和图像处理，这种技术可以提供有...
Entropy Weighted Method 熵权法 Python实现.zip
2024-02-03 20:13

在Python编程环境中，我们可以利用其强大的科学计算库，如NumPy和Pandas，来实现熵权法的计算。熵权法的基本步骤包括以下几个方面： 1. 数据预处理：首先，我们需要收集与决策问题相关的数据，并将其整理成适合...
Python库 | cldpy-0.0.8.tar.gz
2022-03-01 21:08

基于熵的方法通常考虑信息增益，尝试最小化信息熵来确定最佳分割点；基于距离的方法可能涉及到聚类算法，通过计算样本间的距离来划分区间。在实际应用中，`cldpy` 可能提供了以下功能： 1. 自动离散化：根据数据...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 1月20日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 1月12日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月5日

python/pandas 计算 数值 信息熵值

1条回答 默认 最新

问题事件

python/pandas 计算数值信息熵值

1条回答默认最新