326171 2021-03-15 16:13 采纳率: 0%
浏览 14

不太理解下面这个兴趣度选择算法,有大佬详细讲解一下吗?

此代码是《Web日志挖掘技术的研究与应用》陈文臣论文里的算法,求详细讲解

count the NCLR of all distinet pages appeared:

initialize FG1 as the top requested single page groups with Support>=T;

for(i=2;i<=k;i++)

{

  Sort the pages of groups in FGi-1 in lexicographical order:

  for each group{x1,....,xi-1} in FGi-1

  {

    for each group{y1,...,yi-1} in FGi-1

   {

      if(x2=y1 and ....andxi-1=yi-2)

      {

         construct a new group G={x1,.....,xi-1,yi-1};

         if (G not already in FGi)

         {

              test all other combinations of subgroups of G with size(i-1);

              if (all such subgroups are in FGi-1)

              if(Support(G)>=T)

              add G into FGi;

         }

      }

    }

  }

}

  • 写回答

1条回答 默认 最新

  • 憧憬blog 2023-06-27 09:46
    关注

    这个算法被称为Apriori兴趣度选择算法,是一种在数据挖掘中用于发现频繁项集的算法。具体来说,该算法可以用于在大量数据中发现经常一起出现的项,类似于购物篮分析中的“如果客户购买了A,那么他们也可能购买B”的规则。

    算法流程如下:

    1. 初始化:将所有的项按照出现频率排序,选择出现频率最高的项集作为初始频繁项集。

    2. 迭代:对于每个频繁项集,使用该项集中的所有项来生成候选项集,然后计算每个候选项集的支持度,保留支持度大于等于阈值的项集作为下一个频繁项集。

    3. 终止条件:一直重复步骤2,直到无法生成新的频繁项集为止。

    具体到这个代码的实现,它是用来计算Web日志中不同页面出现的频率,并以此来发现页面之间可能存在的关联性。具体来说,算法将所有页面按照出现频率排序,然后从出现频率最高的页面开始,依次生成包含更多页面的组合,直到无法再生成新的组合为止。在生成新的组合时,算法会检查组合中的所有子组合是否都出现在前一次迭代得到的频繁项集中,并计算组合的支持度。如果组合的支持度大于等于阈值,则将其添加到频繁项集中。

    总之,Apriori兴趣度选择算法是一种常用的频繁项集挖掘算法,可以用于发现数据中的关联规则。该算法的基本思想是通过迭代来发现频繁项集,具体实现上需要对项集进行排序、生成候选项集、计算支持度等操作。

    评论

报告相同问题?

悬赏问题

  • ¥15 unity从3D升级到urp管线,打包ab包后,材质全部变紫色
  • ¥50 comsol温度场仿真无法模拟微米级激光光斑
  • ¥15 上传图片时提交的存储类型
  • ¥15 Ubuntu开机显示器只显示kernel,是没操作系统(相关搜索:显卡驱动)
  • ¥15 VB.NET如何绘制倾斜的椭圆
  • ¥15 arbotix没有/cmd_vel话题
  • ¥15 odoo17的分包重新供应路线如何设置?可从销售订单中实时直接触发采购订单或相关单据
  • ¥15 用C语言怎么判断字符串的输入是否符合设定?
  • ¥15 通信专业本科生论文选这两个哪个方向好研究呀
  • ¥50 我在一个购物网站的排队系统排队,这个排队到号后重新定向到目标网站进行购物,但是有技术牛通过技术方法直接跳过排队系统进入目标网址购物,有没有什么软件或者脚本可以用