在文本数据预处理时,下列可以去除的是。
A: 中文: 是的了 这
B: 英文:poor bad the
C: 英文:text moocvisual
D: 中文:科学 颁奖 庞大
A: 中文: 是的了 这
B: 英文:poor bad the
C: 英文:text moocvisual
D: 中文:科学 颁奖 庞大
举一反三
- 在对文本进行分词时,哪些词可以去掉? A: 英文:the, a, bad, poor… B: 中文:文本,可视化,大数据… C: 英文:text, analytics, mooc… D: 中文:的,了,是…
- 在对文本进行分词时,哪些词可以去掉() A: 英文:the,a,an,so,hence… B: 中文:的,了,是… C: 中文:文本,可视化,大数据… D: 英文:text,analytics,mooc…
- 集成开发合同正文为中文文本,附件为()文本() A: 中文 B: 英文 C: 中文或英文 D: 中文和英文
- 中文句子中使用的是( )标点符号,英文句子中用的是( )标点符号,参考文献中用的是( )标点符号。 A: 中文 中文 中文 B: 中文 英文 英文 C: 中文 英文 中文 D: 英文 英文 英文
- 旋转文本只能应用于( ) A: 水平文本和英文 B: 垂直文本和英文 C: 英文 D: 中文