Apriori算法是一种挖掘关联规则的频繁项集算法,其核心思想是通过候选集生成和情节的向下封闭检测两个阶段来挖掘频繁项集。该算法已经被广泛的应用到消费市场价格分析,入侵检测、电商购物推荐等领域。
关联分析是一种在大规模数据集中寻找频繁项集和关联规则的任务。该算法的基本思想是:
(1)首先找出所有的频集,这些项集出现的频繁性至少和预定义的最小支持度一样。
(2)然后由频繁项集产生强关联规则,这些规则必须满足最小支持度和最小可信度。
(3)使用步骤(1)中找到的频繁项集产生期望的规则,产生只包含集合的项的所有规则。一旦这些规则被生成,那么只有那些大于用户给定的最小可信度的规则才被留下来。
(1)优点:简单、易理解、数据要求低
(2)缺点:I/O负载较大、候选项集过多
(3)应用领域:消费市场价格分析,入侵检测、电商购物推荐
本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系我们删除。