• 2021-04-14
    在对文本进行分词时,哪些词可以去掉?
  • 的,了,是…

    内容

    • 0

      在对病历数据进行建模时,以下那些操作是必须的( )。 A: 使用数字对分词后的病历进行标记 B: 计算病历中所含的词的种类 C: 对病历进行分词 D: 打乱分词后的顺序

    • 1

      下面哪些算法不能用于文本的分词?( ) A: 基于规则的分词 B: TF-IDF算法 C: 反向最大匹配法 D: 词嵌入

    • 2

      中文分词的作用是________。 A: 将中文句子划分为以词为单位的词序列 B: 去掉文本中与主题无关的句子 C: 将文本转换为数字向量 D: 从文本中抽取与主题有关的词语

    • 3

      商品评论文本数据的预处理包括哪些工作内容? A: 文本采集 B: 文本去重 C: 短句删除 D: 文本分词 E: 机械压缩去词

    • 4

      使用jieba库提供的______方法,可以对文本进行分词操作。