现有一组交易数据如表所示,请使用所学关联规则算法,求出表中所有的频繁项集和规则,支持度阈值=50%,置信度阈值=100%。
数据表
交易号 | 商品 |
---|---|
100 | a, c, d |
101 | b, c, e |
102 | a, b, c, e |
103 | b, e |
频繁项集分析
频繁1项集
频繁1项集: {a} (50%), {b} (75%), {c} (75%), {e} (75%)
频繁2项集
频繁2项集: {a, c} (50%), {b, c} (50%), {b, e} (75%), {c, e} (50%)
频繁3项集
频繁3项集: {b, c, e} (50%)
关联规则
生成的关联规则:
• a → c (置信度: 100%)
• b → e (置信度: 100%)
• e → b (置信度: 100%)
• {b, c} → e (置信度: 100%)
• {c, e} → b (置信度: 100%)
计算步骤
以下是每个频繁项集和关联规则的详细计算步骤:
频繁1项集计算
- {a}: 出现于交易 100, 102 -> 支持度 = 2/4 = 50%
- {b}: 出现于交易 101, 102, 103 -> 支持度 = 3/4 = 75%
- {c}: 出现于交易 100, 101, 102 -> 支持度 = 3/4 = 75%
- {e}: 出现于交易 101, 102, 103 -> 支持度 = 3/4 = 75%
频繁2项集计算
- {a, c}: 出现于交易 100, 102 -> 支持度 = 2/4 = 50%
- {b, c}: 出现于交易 101, 102 -> 支持度 = 2/4 = 50%
- {b, e}: 出现于交易 101, 102, 103 -> 支持度 = 3/4 = 75%
- {c, e}: 出现于交易 101, 102 -> 支持度 = 2/4 = 50%
频繁3项集计算
- {b, c, e}: 出现于交易 101, 102 -> 支持度 = 2/4 = 50%
本文作者为wzzyhg,转载请注明。