下列哪个不属于常用的文本分类的特征选择算法?()
A: 主成分分析
B: 信息增益
C: 互信息法
D: 卡方检验
A: 主成分分析
B: 信息增益
C: 互信息法
D: 卡方检验
A
举一反三
- 下列哪个不属于常用的文本分类的特征选择算法() A: 卡方检验 B: 互信息 C: 信息增益 D: 主成分分析
- 下列哪个不属于常用的文本分类的特征选择算法?() A: 卡方检验值 B: 互信息 C: 信息增益 D: 主成分分析
- 在决策树算法中,ID3使用哪个度量来进行特征的选择?() A: 信息熵 B: 信息增益比 C: 信息增益 D: Gini指数
- 以下关于决策树算法的说法,正确的是_____。 A: CART算法使用基尼系数来选择划分特征 B: C4.5算法使用信息增益率来选择划分特征 C: ID3算法选择信息增益最大的特征作为划分特征 D: 以上说法都正确
- 有关文本特征的理解,错误的说法是哪个?( ) A: 文本不方便直接处理,需要提取表征内容的特征数值化。 B: TF-IDF和互信息都是文本特征提取的方法。 C: one-hot可以表示一个词的重要性。 D: 信息增益是文本特征提取的方法。
内容
- 0
决策树的( )算法是采用信息增益率作为特征选择标准。
- 1
决策树是一种十分常用的基于规则等有监督学习算法。ID3是一种经典的实现决策树的算法。ID3算法在进行特征选择时选用的优先分枝指标是___。 A: 信息嫡 B: 信息增益 C: 信息增益率 D: GINI系数
- 2
下列对于卡方检验,说法正确的是( ) A: 数据类型为连续性数据的时候选择卡方检验 B: 总体分布状态未知的时候选择卡方检验 C: 卡方检验属于参数检验 D: 卡方检验属于非参数检验
- 3
下列关于C4.5算法的描述不正确的是()。 A: C4.5算法与ID3算法的总体思路是类似的 B: C4.5算法使用信息增益做为选择属性的度量标准 C: C4.5算法使用信息增益率做为选择属性的度量标准 D: 信息增益相同的属性,SplitInformation值越大,信息增益率越小
- 4
C4.5决策树构造算法的特征选择采用( ) A: 条件熵 B: 基尼系数 C: 信息增益 D: 信息熵