• 2021-04-14
    有一包含1,000个样本的数据集,经过特征提取和特征选择,平均每个样本提取出了100个特征,共100,000个,其中不重复的特征为10,000个,如果采用向量空间模型将样本表示为向量,那么每个样本被表示为多少位的向量()
  • 10000

    内容

    • 0

      假设我们有一组样本数据,分为两个类别,且每个样本都由n维特征表示,那么:(

    • 1

      若将训练集记为矩阵X,其中包含了m个样本,每个样本的特征数量为[img=18x17]1803c3bd4c0a815.png[/img]个,则X的维度为 A: [img=41x19]1803c3bd5417fc6.png[/img] B: [img=56x20]1803c3bd5c1e695.png[/img] C: [img=49x19]1803c3bd64aa8e6.png[/img] D: [img=56x20]1803c3bd6cb6b41.png[/img]

    • 2

      下列关于 bootstrap 说法正确的是?( ) A: 从总的 M 个特征中,有放回地抽取 m 个特征(m < M) B: 从总的 M 个特征中,无放回地抽取 m 个特征(m < M) C: 从总的 N 个样本中,有放回地抽取 n 个样本(n < N) D: 从总的 N 个样本中,无放回地抽取 n 个样本(n < N)

    • 3

      有一softmax模型,假设输入x的有m个样本,其特征有d个,所有的输入样本一共有n个类别,则该模型的神经元有()个 A: m B: d C: n D: d*n

    • 4

      KNN算法的分类原理有()。 A: 把已经分类或需要分类的样本在定义的特征空间上表征 B: 需要分类的样本选择特征空间上和自己最邻近的K个样本 C: 需要分类的样本的类别就是这K个样本中最多的那个类别