LDA模型的核心假设是:假设每个文档首先由主题分布表示,然后主题由词概率分布表示,形成文档-主题-词的三级层次。
举一反三
- LDA模型中的一个主题指: A: 词集合上的一个概率分布 B: 词组集合上的一个概率分布 C: 整个文档上的一个概率分布 D: 整个文档集合上的一个概率分布
- LDA模型的隐变量Z是 A: 每个词对应的主题 B: 每篇文档对应的主题 C: 每段话对应的主题 D: 每个词组对应的主题
- LDA模型不包括哪层结构( )。 A: 文档 B: 主题 C: 词 D: 字符
- 下列关于LDA的说法正确的是: A: LDA在PLSA模型的基础上对于话题分布和词项分布赋予了先验分布 B: LDA考虑了文档中词的相对顺序 C: LDA在分析新文档时只能从头进行训练 D: LDA的主题数目是需要事先确定的
- DA算法假设文档中主题的先验分布和主题中词的先验分布都服从狄利克雷分布()