• 2022-06-18
    相比英文文本数据,中文文本数据处理需要的一个特殊步骤是
    A: 去停用词;
    B: 去高频词;
    C: 分词;
    D: 去低频次;
  • C

    内容

    • 0

      文本数据处理的主要步骤包括:①数据分析 ②特征提取 ③分词 ④结果呈现 ⑤文本数据获取下列文本数据处理顺序正确的是( ) A: ①⑤②③④ B: ②⑤③①④ C: ⑤①③②④ D: ⑤③②①④

    • 1

      在对文本进行分词时,哪些词可以去掉? A: 英文:the, a, bad, poor… B: 中文:文本,可视化,大数据… C: 英文:text, analytics, mooc… D: 中文:的,了,是…

    • 2

      在对文本进行分词时,哪些词可以去掉() A: 英文:the,a,an,so,hence… B: 中文:的,了,是… C: 中文:文本,可视化,大数据… D: 英文:text,analytics,mooc…

    • 3

      在文本情感分析过程中,数据预处理是提高数据质量的重要操作,下列属于数据预处理操作的是( )。 A: 去停用词 B: 数据清洗 C: 分词操作 D: 词性标注

    • 4

      英文分词的步骤包括()。 A: 根据空格拆分单词 B: 去停用词 C: 提取词干 D: 规则映射