在对文本进行分词时,哪些词可以去掉?
举一反三
- 在对文本进行分词时,哪些词可以去掉? A: 英文:the, a, bad, poor… B: 中文:文本,可视化,大数据… C: 英文:text, analytics, mooc… D: 中文:的,了,是…
- 在对文本进行分词时,哪些词可以去掉() A: 英文:the,a,an,so,hence… B: 中文:的,了,是… C: 中文:文本,可视化,大数据… D: 英文:text,analytics,mooc…
- 中文分词时,以下哪个词/字可以考虑去掉?
- 在如下有关文本分析的描述中,错误的是( )。 A: 自然语言处理技术不能对词性进行标注 B: 词袋法可将文本转化为计算机能够理解的向量 C: 在对中文文本进行分词处理时,可利用停用词库,对分词进行降噪处理。 D: 在对文本进行分析之前,可先从网络上爬取待分析的文本数据。
- 在如下有关文本分析的描述中,错误的是( ) A: 在对文本进行分析之前,可先从网络上爬取待分析的文本数据 B: 自然语言处理技术不能对词性进行标注 C: 在对中文文本进行分析之前,应将中文文本进行分词处理 D: 词袋法可将文本转化为计算机能够理解的向量