在用于文本分类的隐狄利克雷分布(LDA)模型中,α和β超参数表征什么?()
A: )α:文档中的主题数量,β:假主题中的词条数量
B: α:主题内生成的词条密度,β:假词条中生成的主题密度
C: α:文档中的主题数量,β:假主题中的词条数量
D: α:文档中生成的主题密度,β:真主题内生成的词密度
A: )α:文档中的主题数量,β:假主题中的词条数量
B: α:主题内生成的词条密度,β:假词条中生成的主题密度
C: α:文档中的主题数量,β:假主题中的词条数量
D: α:文档中生成的主题密度,β:真主题内生成的词密度
D
举一反三
- DA算法假设文档中主题的先验分布和主题中词的先验分布都服从狄利克雷分布()
- LDA模型的核心假设是:假设每个文档首先由主题分布表示,然后主题由词概率分布表示,形成文档-主题-词的三级层次。
- LDA模型的隐变量Z是 A: 每个词对应的主题 B: 每篇文档对应的主题 C: 每段话对应的主题 D: 每个词组对应的主题
- 进行主题分析时,根据一信息资源中讨论的主题数量可以划分出()。 A: 主要主题和次要主题 B: 整体主题和局部主题 C: 单主题和多主题 D: 单元主题、复合主题
- 按主题的数量划分主题类型,则有()。 A: 专业主题和非专业主题 B: 单元主题和复合主题 C: 单主题和多主题 D: 显性主题和隐性主题
内容
- 0
按主题的数量划分主题类型,则有()。 A: A专业主题和非专业主题 B: B单元主题和复合主题 C: C单主题和多主题 D: D显性主题和隐性主题
- 1
主题模型的核心,包括?() A: 语料库 B: 文档词频 C: 主题比重 D: 主题词频
- 2
LDA模型不包括哪层结构( )。 A: 文档 B: 主题 C: 词 D: 字符
- 3
关于主题建模,总体语句占比多少才是正确的?1.它是一个监督学习技巧2.线性判别分析(LDA)可用于执行主题建模3.模型中主题数量的选择不取决于数据的大小4.主题术语的数量与数据的大小成正比() A: A.0 B: B.25 C: C.50 D: D.75 E: E.100
- 4
在Word 2019中,有关文档主题的下列描述中,正确的是( )。 A: 文档主题是一组具有统一外观的格式选项,用户不能创建主题 B: 用户不能创建主题颜色 C: 用户不能创建主题字体 D: 用户不能创建主题效果