最开始是用类似这样的数据测试的:
g a b c
0 0 0 0
0 0 1 0
0 1 0 0
1 1 1 0
0 1 1 1
用的是 RapidMiner 中的 FP-Growth 配合 Create Association Rules。g 代表 good,好结果的意思。a、b、c是不同的变量。在这里只有 a 和 b 为 1,c 为 0 才会导致 g 为 1。但是我试了一下,好像发掘不出正确的关联规则。然后我突发奇想把所有内容都取反的值加了进去,变成下面这样:
g ng a na b nb c nc
0 1 0 1 0 1 0 1
0 1 0 1 1 0 0 1
0 1 1 0 0 1 0 1
1 0 1 0 1 0 0 1
0 1 1 0 1 0 1 0
然后就能发掘出正确的关联规则了,就是 [nc, a, b] --> [g]。不过也有很多无关的关联规则。
不知道有没有更好的方法。另外我这个方法不知道有没有什么问题?