在分类问题中,我们经常会遇到正负样本数据量不等的情况,比如正样本为10万条数据,负样本只有1万条数据,以下合适的处理方法是 ( )
A: 从10万正样本中随机抽取1万参与分类
B: 将负样本重复10次,生成10万样本量,打乱顺序参与分类
C: 直接进行分类,可以最大限度利用数据
D: 将负样本每个权重设置为10,正样本权重为1,参与训练过程
A: 从10万正样本中随机抽取1万参与分类
B: 将负样本重复10次,生成10万样本量,打乱顺序参与分类
C: 直接进行分类,可以最大限度利用数据
D: 将负样本每个权重设置为10,正样本权重为1,参与训练过程
举一反三
- 在分类问题中,我们经常会遇到正负样本数据量不等的情况,比如正样本为10w条数据,负样本只有1w条数据,以下最合适的处理方法是()? A: 将负样本重复10次,生成10w样本量,打乱顺序参与分类 B: 直接进行分类,可以最大限度利用数据 C: 从10w正样本中随机抽取1w参与分类 D: 将负样本每个权重设置为10,正样本权重为1,参与训练过程
- 人工神经网络在学习过程中,需要通过数据集进行训练。下列关于训练数据集描述正确的是()我们经常会需要一个样本集,它既有正例也有反例,那些支持这个结论的就是正例,不支持就是反例。 A: 只有正样本 B: 既要有负样本、又要有正样本 C: 只有负样本 D: 当负样本训练出来的结果一样也是负样本,那么可以不用调节参数模型
- 分类器是基于现有数据构造出一个模型或者函数,以将数据库中的数据映射到给定类别,从而可以应用于数据预测。常包含以下步骤:①在训练样本上执行分类器算法,生成分类模型。②在测试样本上执行分类模型,生成预测结果。③选定样本(包含正样本和负样本),将所有样本分成训练样本和测试样本。④根据预测结果,计算必要的评估指标,评估分类模型的性能。构造和实施分类器的正确顺序为()
- 混淆矩阵中FN(False Negative)的含义是? A: 将负样本识别为负样本的数量(或概率) B: 将正样本识别为负样本的数量(或概率) C: 将负样本识别为正样本的数量(或概率) D: 将正样本识别为正样本的数量(或概率)
- 下列对混淆矩阵说法正确的是()。 A: TP:将正样本识别为正样本的数目(概率) B: FP:将负样本识别为正样本的数目(概率) C: FN:将正样本识别为负样本的数目(概率) D: TN:将负样本识别为正样本的数目(概率)