文档检索的向量空间模型是指将文档用向量表示,通过向量的计算来反映文档之间的相似度
对
举一反三
- 在向量模型中,不可以通过()来衡量文档和查询之间的相似度。 A: 向量间距离 B: 向量内积 C: 向量间夹角大小 D: 向量间正切值
- 大多数中文文本分类系统都采用词作为(),称作特征词。这些特征词作为文档的中间表示形式,用来实现文档与文档、文档与用户目标之间的相似度计算。 A: 自变量 B: 因变量 C: 特征项 D: 向量
- 关于文档的向量表示模型,采用深度学习中的词向量表示模型和传统的单纯基于词频向量表示方法的区别的描述错误的是
- 在向量空间模型中,两篇文档接近等价于:</p></p>
- 下列对三种检索模型描述错误的是 A: 布尔模型的检索结果不能反应文档的相关性大小 B: 向量空间模型的维数越多,检索性能越好 C: 概率模型通过计算标引词的分布来判断文档与检索的相关度 D: 概率模型需要提供用户的反馈机制
内容
- 0
关于文档的向量表示模型,采用深度学习中的词向量表示模型和传统的单纯基于词频向量表示方法的区别的描述错误的是 A: 传统文档的表示一般采用词袋BOW模型,表示为高维向量 B: 深度学习中的词向量表示模型通常是一种低维度向量 C: 深度学习中的词向量表示模型存在的一个突出问题就是“词汇鸿沟”现象 D: 传统方法中词向量表示模型存在一个突出问题就是“词汇鸿沟”现象
- 1
下列关于信息检索模型的叙述中,错误的是( )。 A: 布尔检索模型可以对检索结果进行重要性排序 B: 概率检索模型假定检索系统中存在着一个只包含与提问相关的文档的理想集合 C: 向量空间检索模型将文献与查询的匹配问题转化为关于向量空间的计算问题 D: 模糊检索模型将文献看成与提问在一定程度上相关
- 2
两个文档向量d1和d2的值为:d1=(1,0,3,0,2),d2=(3,2,0,0,1),则它们的余弦相似度为:()
- 3
经典距离度量中比较适合度量文档词频向量之间相似性的是 ______ 。
- 4
向量a=(2,1,-1),向量b=(1,-1,2), (1) 向量a 与向量b 的向量积是; (用坐标表示) (3) 向量3a 与向量2b 的向量积是(用坐标表示)