下列是Apriori算法生成频繁项集主要步骤,对其进行排序正确的是( )(1)扫描交易记录来查看哪些项集满足最小支持度要求,那些不满足最小支持度的项集会被去掉。(2)接下来重新扫描交易记录,去掉不满足最小支持度的2-项集。 (3)接下来重新扫描交易记录,去掉不满足最小支持度的项集,重复进行直到所有项集都被去掉。(4)首先会生成所有单个物品的项集列表 。(5)对剩下的1-频繁项集进行组合并生成包含两个元素的项集 。(6)对剩下的2-频繁项集进行组合并生成包含三个元素的项集 。
A: (4)(5)(2)(6)(3)
B: (1)(2)(3)(4)(5)(6)
C: (4)(1)(5)(2)(6)(3)
D: (4)(5)(1)(2)(6)(3)
A: (4)(5)(2)(6)(3)
B: (1)(2)(3)(4)(5)(6)
C: (4)(1)(5)(2)(6)(3)
D: (4)(5)(1)(2)(6)(3)
举一反三
- 从三个频繁项集 {1, 2}, {1, 3}, {1, 4} 中能生成以下哪个可能频繁的项集: </p></p>
- 如果项集I的相对支持度满足预定义的最小支持度阈值,则I是频繁项集。
- 对频繁项集、频繁闭项集、极大频繁项集的关系描述正确的是()[注:分别以1、2、3代表之]
- 关联规则数据挖掘算法的基本步骤是: A: 先找出事物数据库中最长频繁项集,再利用最长频繁项集逐层迭代生成渐短频繁项集,直到1频繁集 B: 先找出事物数据库中所有大于平均支持度的项集,再在这些项集中找出所有大于平均置信度的项集 C: 先找出事物数据库中所有大于平均置信度的项集,再在这些项集中找出所有大于平均支持度的项集 D: 先找出事物数据库中所有频繁项集,再利用频繁项集生成所需要的关联规则
- 已知a={a, b, d)是满足最小支持度的频繁项集,若不考虑置信度,由c(可产生关 联规则的数量为()。 A: 3 B: 4 C: 5 D: 6