0%

从关联规则到Apriori算法

关联规则

支持度和置信度

举例说明:

由此可见,关联规则挖掘的目标即为,规定交易集合,找到所有满足最小支持度(minsup)和最小置信度(minconf)的规则。而在实际运用中,即需要找到所有满足条件的规则,又不能将数据全部读入内存进行计算。

频繁集挖掘算法

频繁集

Apriori算法是关联规则挖掘中最著名的算法,算法分为两个步骤:

  1. 寻找所有满足最小支持度minsup的频繁集(frequent itemset)
  2. 基于频繁集产生规则

由此产生的频繁集挖掘算法:

Apriori算法

Apriori算法过程

函数 $candidate-gen(F_{k-1})$:


Apriori算法举例

步骤1: 寻找频繁集

步骤2: 生成规则


总结

参考文献:
[1] 徐君,《网络数据挖掘》,中国科学院大学2017年秋季研究生课程