相比英文文本数据,中文文本数据处理需要的一个特殊步骤是
A: 去停用词;
B: 去高频词;
C: 分词;
D: 去低频次;
A: 去停用词;
B: 去高频词;
C: 分词;
D: 去低频次;
C
举一反三
内容
- 0
文本数据处理的主要步骤包括:①数据分析 ②特征提取 ③分词 ④结果呈现 ⑤文本数据获取下列文本数据处理顺序正确的是( ) A: ①⑤②③④ B: ②⑤③①④ C: ⑤①③②④ D: ⑤③②①④
- 1
在对文本进行分词时,哪些词可以去掉? A: 英文:the, a, bad, poor… B: 中文:文本,可视化,大数据… C: 英文:text, analytics, mooc… D: 中文:的,了,是…
- 2
在对文本进行分词时,哪些词可以去掉() A: 英文:the,a,an,so,hence… B: 中文:的,了,是… C: 中文:文本,可视化,大数据… D: 英文:text,analytics,mooc…
- 3
在文本情感分析过程中,数据预处理是提高数据质量的重要操作,下列属于数据预处理操作的是( )。 A: 去停用词 B: 数据清洗 C: 分词操作 D: 词性标注
- 4
英文分词的步骤包括()。 A: 根据空格拆分单词 B: 去停用词 C: 提取词干 D: 规则映射