• 2022-06-19
    文本分析中的中文分词方案有基于()的分词算法和基于统计的机器学习算法。
  • 词典

    内容

    • 0

      ()是一种基于词典和人工规则的方法。是按照一定的策略将待分析的汉字串与一个“充分大的”机器词典中的词条进行配,若在词典中找到某个字符串,则匹配成功。 A: 机械分词算法 B: 基于统计的分词算法 C: 非机械分词算法 D: 随机分词法

    • 1

      在关于中文分词的说法中,正确的是( ) A: 基于字符串匹配的分词,歧义词识别比较强 B: 基于统计的分词在新词理解上比较差 C: 基于理解的分词不需要词典 D: 基于统计的分词速度快

    • 2

      下面哪些算法不能用于文本的分词?( ) A: 基于规则的分词 B: TF-IDF算法 C: 反向最大匹配法 D: 词嵌入

    • 3

      就分词来讲,主要有三类分词方法( )。 A: 基于词典的分词方法 B: 基于统计的分词方法 C: 基于语法的分词方法 D: 基于规则的分词方法

    • 4

      在关于中文分词的说法中,正确的是( ) A: 基于理解的分词需要语料库 B: 基于统计的分词技术很成熟 C: 基于字符串匹配的分词需要规则库 D: 若干理解的分词实施起来很困难