• 2022-06-28
    常见的文本特征提取方法包括( )。
    A: LSI
    B: TF-IDF
    C: 词嵌入
    D: 向量空间模型
  • A,B,C,D

    内容

    • 0

      以下哪些属于文本分析模型?( ) A: TextRank B: 主题模型 C: TF-IDF D: 统计语言模型

    • 1

      有一包含1,000个样本的数据集,经过特征提取和特征选择,平均每个样本提取出了100个特征,共100,000个,其中不重复的特征为10,000个,如果采用向量空间模型将样本表示为向量,那么每个样本被表示为多少位的向量()

    • 2

      请简要介绍向量空间模型中几种常见的模型。

    • 3

      文本语料库的可能特征是什么( )。 A: 词性标注 B: 全是 C: 词的向量标注 D: 文本中词计数

    • 4

      不属于关键词提取算法的是() A: TF-IDF算法 B: TextRank算法 C: 主题模型算法 D: 关联算法