中国大学MOOC: 相比英文文本数据,中文文本数据处理需要的一个特殊步骤是
举一反三
- 相比英文文本数据,中文文本数据处理需要的一个特殊步骤是 A: 去停用词; B: 去高频词; C: 分词; D: 去低频次;
- 文本数据处理的主要步骤包括:①数据分析 ②特征提取 ③分词 ④结果呈现 ⑤文本数据获取下列文本数据处理顺序正确的是( ) A: ①⑤②③④ B: ②⑤③①④ C: ⑤①③②④ D: ⑤③②①④
- 在对文本进行分词时,哪些词可以去掉? A: 英文:the, a, bad, poor… B: 中文:文本,可视化,大数据… C: 英文:text, analytics, mooc… D: 中文:的,了,是…
- 在对文本进行分词时,哪些词可以去掉() A: 英文:the,a,an,so,hence… B: 中文:的,了,是… C: 中文:文本,可视化,大数据… D: 英文:text,analytics,mooc…
- 请描述中文文本数据的词云绘制步骤