关联性分析中置信度和支持度咋算(标签-数据分析)

数据分析中关联性分析
算出数据中的支持度和置信度

df_Frequent_Itemsets = apriori(df_ShoppingCarts_sets
, min_support=0.07
, use_colnames=True)

有兴趣的wx

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

5条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
「已注销」 2023-02-01 16:44
关注
该回答引用chatGPT
置信度表示A项目集出现的同时B项目集也出现的概率，计算公式为：Confidence(A → B) = Support(A & B) / Support(A)

支持度表示A项目集出现的概率，计算公式为：Support(A) = number of transactions containing A / total number of transactions

在您的代码中，使用了Apriori算法对df_ShoppingCarts_sets数据进行关联性分析，并且将支持度设置为0.07。您可以从df_Frequent_Itemsets中提取置信度和支持度的数据。
代码如下:

from mlxtend.frequent_patterns import apriori # 执行Apriori算法 df_Frequent_Itemsets = apriori(df_ShoppingCarts_sets, min_support=0.07, use_colnames=True) # 计算置信度 def calculate_confidence(row): confidence = row['support'] / df_Frequent_Itemsets[df_Frequent_Itemsets['itemsets'] == row['antecedent']]['support'].iloc[0] return confidence df_Frequent_Itemsets['confidence'] = df_Frequent_Itemsets.apply(calculate_confidence, axis=1) # 打印结果 print(df_Frequent_Itemsets)

在计算支持度之前，请确保您已经使用Apriori算法或其他算法对数据进行了关联性分析，并且已经得到了频繁项集。

以下是一段示例代码，可以帮助您计算支持度和置信度：

# 频繁项集数据 frequent_itemsets = apriori(df, min_support=0.3, use_colnames=True) # 计算支持度 total_transactions = df.shape[0] frequent_itemsets['support'] = frequent_itemsets['support'] / total_transactions # 计算置信度 for i in range(frequent_itemsets.shape[0]): antecedent = frequent_itemsets.iloc[i]['itemsets'][:-1] support_antecedent = frequent_itemsets[frequent_itemsets['itemsets'] == antecedent]['support'].values[0] frequent_itemsets.at[i, 'confidence'] = frequent_itemsets.iloc[i]['support'] / support_antecedent # 打印结果 print(frequent_itemsets)

这里使用了Pandas库来处理数据，假设您的数据存储在名为df的DataFrame中。您可以通过更改min_support的值来调整支持度的阈值。
解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python文本中出现的词汇关联性分析 python
2022-09-27 16:51

回答 1 已采纳可以参考： https://www.jianshu.com/p/c4f
Fahion-MNIST(图像分类数据集)的样本标签不可以使用中文 python 人工智能
2022-07-29 22:21

回答 1 已采纳字体问题，在这之前加一句d2l.plt.rcParams['font.sans-serif'] = 'SimHei' 就可以解决
如何在Shopify的页面中实现实时显示数据(语言-javascript) javascript 嵌入式实时数据库爬虫
2022-10-12 05:53

回答 4 已采纳简单来讲，可以有两种方式来实现：1、网页前端使用一个定时器去后台轮询，请求数据，当有新数据时，就在网页上展示更新。2、使用websocket技术，在后台讲新数据推送到前端来。以上这两种技术都是可以的，
Python数据挖掘项目开发实战_用亲和性分析方法推荐电影_编程案例实例详解课程教程.pdf
2023-05-07 08:07

通过具体的编程案例，学习者将掌握如何在实际项目中运用这些理论知识，提升数据分析和推荐系统构建的能力。通过学习这门课程，你将能够设计并实施自己的电影推荐系统，解决数据稀疏问题，为用户提供更精准的个性化...
pandas的loc和isin的用法问题 python 开发语言数据分析
2022-08-12 15:22

回答 3 已采纳可以用query语句
beta版使用Unicode UTF-8提供全球语言支持 c++
2022-10-04 21:19

回答 1 已采纳不要勾选这个，勾了后很多程序会乱码。
下面关于B-树和B+树的叙述中，数据结构算法链表
2023-02-03 14:19

回答 2 已采纳 B-树仅支持随机查找，B+树支持随机查找和顺序查找，希望对你有帮助，望采纳
R语言meta分析-抑郁症认知矫正分析.zip
2024-03-28 10:40

它拥有丰富的库和包，为数据分析提供了强大支持。在这个项目中，R被用来进行meta分析。 2. **Meta分析**：Meta分析是系统评价的一种形式，它通过数学方法将多个研究的结果结合起来，以提供对某种干预或关联的更准确...
Go编程语言中的异常支持
2018-07-17 20:01

回答 1 已采纳 Go does not have exceptions, and that is a design decision, not based on performance: We belie
如何用css动画实现：页面加载时a标签中的文字旋转360度？ css
2021-07-12 23:45

回答 2 已采纳用 js 控制style transform:rotate(7deg);
请问大佬们，java编程思想这里的画线部分和图是什么意思？ java java-ee 开发语言
2020-11-02 18:53

回答 1 已采纳这个是说在c++中可以class继承class，但是java不能，java是单继承，但是他可以多实现，java没必要继承多个类，他实现多个接口就可以了
Python商业数据分析教学课件09.pptx
2023-06-12 00:14

在示例中，我们计算了不同项集的支持度和不同规则的置信度，比如 "Python基础教程 -> 深度学习" 的规则。在Python中，我们可以利用`mlxtend`库的`apriori`模块来实现Apriori算法。除了支持度和置信度，还可以使用*...
umy-ui表格如何获取滚动条高度呢？ elementui
2022-01-19 17:08

回答 1 已采纳你打印下this.$refs.brandListTableRef看看，版本不一样，里面的值会有所不同
【毕业设计】大数据购物商品数据关联分析 - Apriori python
2022-11-18 10:53

caxiou的博客为了大家能够顺利以及最少的精力通过毕设，学长分享优质毕业设计项目，今天要分享的新项目是基于Apriori的购物商品关联分析学长这里给一个题目综合评分(每项满分5分)难度系数：4分工作量：4分。
数据挖掘技术在高校成绩分析中的应用研究.pdf
2021-07-14 15:01

在实际操作过程中，数据挖掘的步骤包括建立数据表、统计成绩等级的出现次数、找出频繁项集、计算非空子集的置信度，并将满足最小置信度阈值的规则筛选出来。这个过程需要使用特定的数据挖掘软件或编程语言实现。 ...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 2月9日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 2月1日

悬赏问题

¥20 WPF MVVM模式 handycontrol 框架， hc:SearchBar 控件 Text="{Binding NavMenusKeyWords}" 绑定取不到值
¥15 需要手写数字信号处理Dsp三个简单题不用太复杂
¥15 数字信号处理考试111
¥15 allegro17.2生成bom表是空白的
¥15 请问一下怎么打通CAN通讯
¥20 如何在 rocky9.4 部署 CDH6.3.2？
¥35 navicat将excel中的数据导入mysql出错
¥15 rt-thread线程切换的问题
¥15 高通uboot 打印ubi init err 22
¥15 R语言中lasso回归报错

关联性分析中置信度和支持度咋算(标签-数据分析)

5条回答 默认 最新

问题事件

悬赏问题

5条回答默认最新