频繁项集关联规则

wzzyhg 152 0

现有一组交易数据如表所示,请使用所学关联规则算法,求出表中所有的频繁项集和规则,支持度阈值=50%,置信度阈值=100%。

数据挖掘关联规则的apriori

数据表

交易号 商品
100 a, c, d
101 b, c, e
102 a, b, c, e
103 b, e

频繁项集分析

频繁1项集
频繁1项集: {a} (50%), {b} (75%), {c} (75%), {e} (75%)
频繁2项集
频繁2项集: {a, c} (50%), {b, c} (50%), {b, e} (75%), {c, e} (50%)
频繁3项集
频繁3项集: {b, c, e} (50%)

关联规则

生成的关联规则:
• a → c (置信度: 100%)
• b → e (置信度: 100%)
• e → b (置信度: 100%)
• {b, c} → e (置信度: 100%)
• {c, e} → b (置信度: 100%)

计算步骤

以下是每个频繁项集和关联规则的详细计算步骤:

频繁1项集计算

  1. {a}: 出现于交易 100, 102 -> 支持度 = 2/4 = 50%
  2. {b}: 出现于交易 101, 102, 103 -> 支持度 = 3/4 = 75%
  3. {c}: 出现于交易 100, 101, 102 -> 支持度 = 3/4 = 75%
  4. {e}: 出现于交易 101, 102, 103 -> 支持度 = 3/4 = 75%

频繁2项集计算

  1. {a, c}: 出现于交易 100, 102 -> 支持度 = 2/4 = 50%
  2. {b, c}: 出现于交易 101, 102 -> 支持度 = 2/4 = 50%
  3. {b, e}: 出现于交易 101, 102, 103 -> 支持度 = 3/4 = 75%
  4. {c, e}: 出现于交易 101, 102 -> 支持度 = 2/4 = 50%

频繁3项集计算

  1. {b, c, e}: 出现于交易 101, 102 -> 支持度 = 2/4 = 50%

发表评论 取消回复
表情 图片 链接 代码

分享