主题模型的核心,包括?()
A: 语料库
B: 文档词频
C: 主题比重
D: 主题词频
A: 语料库
B: 文档词频
C: 主题比重
D: 主题词频
举一反三
- 在主题模型中,利用矩阵记号,可以将文文件词频、主题比重、主题词频三者的关系表示为?() A: 主题词频=主题比重×文文件词频 B: 文文件词频=主题比重×主题词频 C: 主题比重=文文件词频×主题词频 D: 主题词频=主题比重/文文件词频 E: 文文件词频=主题比重/主题词频
- 针对文本挖掘,下列叙述何者为非?() A: 词频统计的方法中,对于要将单一主题的文文件从海量的语料库中发掘出来是很轻易的,不需要借助额外的技术来获取词频向量 B: 主题模型(topicmodel)是描述语料库及其中潜在的一类数字模型,首先考虑到的是如何用数学语言去描述一个主题 C: 词频向量是由所有的词频组合在一起,同时,词频为该字词在文本出现的总数除以文档中的总词语数 D: 文党的词频、主题的比重、主题的词频三者之间的关系为D(文档词频)=W(主题比重)*T(主题词频) E: 文本挖掘技术基本上属于无监督学习方法
- 语料库中独立的文本是?() A: 语料库 B: 文档 C: 主题 D: 词袋
- 关于中文在线字、词频统计工具,下列说法正确的有()。 A: 语料库在线这个网站可以统计字频。 B: 语料库在线这个网站可以统计词频。 C: 语料库在线这个网站进行字频统计、词频统计是免费的。 D: 语料库在线这个网站中提供字词频统计软件,可以免费下载后安装使用。
- 下列网站可以进行词频统计的是()。 A: 大家论坛 B: 果壳网 C: 语料库在线 D: 石墨文档