有关文本特征的理解,错误的说法是哪个?( )
A: 文本不方便直接处理,需要提取表征内容的特征数值化。
B: TF-IDF和互信息都是文本特征提取的方法。
C: one-hot可以表示一个词的重要性。
D: 信息增益是文本特征提取的方法。
A: 文本不方便直接处理,需要提取表征内容的特征数值化。
B: TF-IDF和互信息都是文本特征提取的方法。
C: one-hot可以表示一个词的重要性。
D: 信息增益是文本特征提取的方法。
举一反三
- 下列不属于文本分析过程的是( )。 A: 分词 B: 文本聚类 C: 特征提取与表示 D: 知识提取
- 常见的文本特征提取方法包括( )。 A: LSI B: TF-IDF C: 词嵌入 D: 向量空间模型
- 文本数据处理的基本步骤包括文本采集、文本预处理、特征提取与特征选择、建模分析等。
- 有关文本分析的说法,正确的是哪些?( ) A: 文本属于非结构化数据,因此需要经过预处理转化为向量等结构才方便处理。 B: 处理文本分类需要经历原始文本的提取、分词等预处理、特征提取与表示、分类模型构建以及评估等阶段。 C: 从一个文本集中查询包含某些主题的文本也属于文本分析。 D: 从一个word文档中查询是否包含某个词汇属于文本分析。
- 语音合成技术的主要目标是:()。 A: 、通过声纹波形提取特征 B: 、识别关键词,并返回状态 C: 、根据文本信息生成语音信息 D: 、根据语音信息生成文本信息