针对文本挖掘，下列叙述何者为非？（） A: 词频统计的方法中，对于要将单一主题的文文件从海量的语料库中发掘出来是很轻易的，不需要借助额外的技术来获取词频向量 B: 主题模型（topicmodel）是描述语料库及其中潜在的一类数字模型，首先考虑到的是如何用数学语言去描述一个主题 C: 词频向量是由所有的词频组合在一起，同时，词频为该字词在文本出现的总数除以文档中的总词语数 D: 文党的词频、主题的比重、主题的词频三者之间的关系为D（文档词频）=W（主题比重）*T（主题词频） E: 文本挖掘技术基本上属于无监督学习方法

公告：维护QQ群：833371870，欢迎加入！
公告：维护QQ群：833371870，欢迎加入！
公告：维护QQ群：833371870，欢迎加入！

2022-06-28

针对文本挖掘，下列叙述何者为非？（） A: 词频统计的方法中，对于要将单一主题的文文件从海量的语料库中发掘出来是很轻易的，不需要借助额外的技术来获取词频向量 B: 主题模型（topicmodel）是描述语料库及其中潜在的一类数字模型，首先考虑到的是如何用数学语言去描述一个主题 C: 词频向量是由所有的词频组合在一起，同时，词频为该字词在文本出现的总数除以文档中的总词语数 D: 文党的词频、主题的比重、主题的词频三者之间的关系为D（文档词频）=W（主题比重）*T（主题词频） E: 文本挖掘技术基本上属于无监督学习方法

针对文本挖掘，下列叙述何者为非？（）
A: 词频统计的方法中，对于要将单一主题的文文件从海量的语料库中发掘出来是很轻易的，不需要借助额外的技术来获取词频向量
B: 主题模型（topicmodel）是描述语料库及其中潜在的一类数字模型，首先考虑到的是如何用数学语言去描述一个主题
C: 词频向量是由所有的词频组合在一起，同时，词频为该字词在文本出现的总数除以文档中的总词语数
D: 文党的词频、主题的比重、主题的词频三者之间的关系为D（文档词频）=W（主题比重）*T（主题词频）
E: 文本挖掘技术基本上属于无监督学习方法

答案：

A

举一反三

内容

0
关于中文在线字、词频统计工具，下列说法正确的有（）。 A: 语料库在线这个网站可以统计字频。 B: 语料库在线这个网站可以统计词频。 C: 语料库在线这个网站进行字频统计、词频统计是免费的。 D: 语料库在线这个网站中提供字词频统计软件，可以免费下载后安装使用。
1
北语的汉语词频统计语料库有哪些特点？
2
经典距离度量中比较适合度量文档词频向量之间相似性的是 ______ 。
3
词频向量有什么作用？
4
中国知网(CNKI)可以对用户输入的检索词进行词频控制,下列说法正确的是? A: 该词频指检索词在相应检索字段中出现的频次 B: 该词频指检索词在该数据库中被用户检索过的总频次 C: 该词频指检索词在全文中出现的频次 D: 词频为3,表示检索词在全文中至少出现3次