举一反三
- 利用Apriori 算法计算频繁项集可以有效降低计算频繁集的时间复杂度。在以下的购物篮中产生支持度不小于3的候选3-项集
- 请根据Apriori算法回答以下问题 利用Apriori算法计算频繁项集可以有效降低计算频繁集的时间复杂度。在以下的购物篮中产生支持度不小于3的候选3-项集,在候选2-项集中需要剪枝的是() A: 啤酒、尿布 B: 啤酒、面包 C: 面包、尿布 D: 啤酒、牛奶
- 在Apriori算法中,在得到频繁的k-1项集之后,通过以下哪种连接方法,生成k-项集候选 A: 所有的k-项集都看做可能的候选集 B: 通过频繁的k-1项集和频繁的1项集连接生成频繁的k-项集候选 C: 通过合并一对频繁的k-1项集生成频繁的k项集候选 D: 以上都不是
- Apriori算法的核心是 A: 通过连接产生候选项与其支持度,然后通过剪枝生成频繁项集。 B: 提出不产生候选项与其支持度的方法。 C: 采用垂直数据表示形式 D: 不产成候选频繁项集的方法。
- Apriori算法挖掘频繁项集的过程主要包含()。 A: 连接 B: 剪枝 C: k-项集 D: k-1频繁项集
内容
- 0
Apriori算法生成频繁项集的过程中,不包括如下哪项? A: 剪枝 B: 支持度计数 C: 连接 D: 置信度计算
- 1
下列是Apriori算法生成频繁项集主要步骤,对其进行排序正确的是( )(1)扫描交易记录来查看哪些项集满足最小支持度要求,那些不满足最小支持度的项集会被去掉。(2)接下来重新扫描交易记录,去掉不满足最小支持度的2-项集。 (3)接下来重新扫描交易记录,去掉不满足最小支持度的项集,重复进行直到所有项集都被去掉。(4)首先会生成所有单个物品的项集列表 。(5)对剩下的1-频繁项集进行组合并生成包含两个元素的项集 。(6)对剩下的2-频繁项集进行组合并生成包含三个元素的项集 。 A: (4)(5)(2)(6)(3) B: (1)(2)(3)(4)(5)(6) C: (4)(1)(5)(2)(6)(3) D: (4)(5)(1)(2)(6)(3)
- 2
关联规则数据挖掘算法的基本步骤是: A: 先找出事物数据库中最长频繁项集,再利用最长频繁项集逐层迭代生成渐短频繁项集,直到1频繁集 B: 先找出事物数据库中所有大于平均支持度的项集,再在这些项集中找出所有大于平均置信度的项集 C: 先找出事物数据库中所有大于平均置信度的项集,再在这些项集中找出所有大于平均支持度的项集 D: 先找出事物数据库中所有频繁项集,再利用频繁项集生成所需要的关联规则
- 3
下面关于频繁项集、最大频繁项集和频繁闭项集的说法中,哪一个不正确? A: 对于同一个事务数据库和一样的支持度阈值,最大频繁项集集合必然是频繁闭项集集合的子集 B: 对于同一个事务数据库和一样的支持度阈值,频繁闭项集必然是频繁项集 C: 若{A,B}和{A,B,C}的支持度不相等,则{A,B,C}的支持度比{A,B}的小 D: 若{A,B}和{A,B,C}的支持度相等,则{A,B,D}可能是闭项集
- 4
考虑下面的频繁3-项集的集合:{1,2,3},{1,2,4}...并策略,由候选产生过程得到4-项集不包含