在用于文本分类的隐狄利克雷分布(LDA)模型中,α和β超参数表征什么?()
A: )α:文档中的主题数量,β:假主题中的词条数量
B: α:主题内生成的词条密度,β:假词条中生成的主题密度
C: α:文档中的主题数量,β:假主题中的词条数量
D: α:文档中生成的主题密度,β:真主题内生成的词密度
A: )α:文档中的主题数量,β:假主题中的词条数量
B: α:主题内生成的词条密度,β:假词条中生成的主题密度
C: α:文档中的主题数量,β:假主题中的词条数量
D: α:文档中生成的主题密度,β:真主题内生成的词密度
举一反三
- DA算法假设文档中主题的先验分布和主题中词的先验分布都服从狄利克雷分布()
- LDA模型的核心假设是:假设每个文档首先由主题分布表示,然后主题由词概率分布表示,形成文档-主题-词的三级层次。
- LDA模型的隐变量Z是 A: 每个词对应的主题 B: 每篇文档对应的主题 C: 每段话对应的主题 D: 每个词组对应的主题
- 进行主题分析时,根据一信息资源中讨论的主题数量可以划分出()。 A: 主要主题和次要主题 B: 整体主题和局部主题 C: 单主题和多主题 D: 单元主题、复合主题
- 按主题的数量划分主题类型,则有()。 A: 专业主题和非专业主题 B: 单元主题和复合主题 C: 单主题和多主题 D: 显性主题和隐性主题