常见的文本特征提取方法包括( )。
A: LSI
B: TF-IDF
C: 词嵌入
D: 向量空间模型
A: LSI
B: TF-IDF
C: 词嵌入
D: 向量空间模型
举一反三
- 有关文本特征的理解,错误的说法是哪个?( ) A: 文本不方便直接处理,需要提取表征内容的特征数值化。 B: TF-IDF和互信息都是文本特征提取的方法。 C: one-hot可以表示一个词的重要性。 D: 信息增益是文本特征提取的方法。
- 以下那种不属于文本信息分析的方法 A: 词袋模型 B: 广度优先搜索 C: TF-IDF D: 基于贝叶斯的概率模型
- 词袋模型是常用的文本特征提取方式。()
- 下面哪些算法不能用于文本的分词?( ) A: 基于规则的分词 B: TF-IDF算法 C: 反向最大匹配法 D: 词嵌入
- 在下列数据特征提取方法中,________常用于对语音时序数据的特征提取。 A: TF-IDF B: MFCC C: BOW D: ARIMA