在一个包含5000个特征及超过一百万个观测值的数据集上建立一个机器学习的模型,下面哪种方法能更高效地训练模型?()
A: 使用在线学习算法
B: 从数据集中随机抽取样本来建立模型
C: 使用主成分分析法(PCA)对数据降维
D: 使用支持向量机SVM来建立模型
A: 使用在线学习算法
B: 从数据集中随机抽取样本来建立模型
C: 使用主成分分析法(PCA)对数据降维
D: 使用支持向量机SVM来建立模型
A,B,C
举一反三
- 想要训练一个ML模型,样本数量有100万个,特征维度是5000,面对如此大数据,如何有效地训练模型( )? A: 对训练集随机采样,在随机采样的数据上建立模型 B: 尝试使用在线机器学习算法 C: 使用PCA算法减少特征维度
- 我们想要训练一个 ML 模型,样本数量有 100 万个,特征维度是 5000,面对如此大数据,如何有效地训练模型?( ) A: 对训练集随机采样,在随机采样的数据上建立模型 B: 尝试使用在线机器学习算法 C: 使用 PCA 算法减少特征维度 D: 选项中都不对
- 机器学习系统使用什么来建立并更新模型? A: 样本数据 B: 继承模型 C: 标签数据 D: 计算能力
- 在机器学习过程中,训练过程中使用的数据样本集合称为 A: 训练集 B: 结果集 C: 模型集 D: 学习集
- 在训练数据集上模型执行得很好,说明是个好模型。
内容
- 0
机器学习算法在哪一过程中使用? A: 数据准备 B: 训练过程 C: 测试过程 D: 模型选择
- 1
以下哪些不是机器学习的过程()? A: 模型选择 B: 数据集划分 C: 深度学习 D: 数据清洗 E: 集成学习 F: 模型建立
- 2
神经网络模型是数据挖据中常见的一种模仿人类思维方式的机器学习算法模型,在用于预测分析时,先需要通过一个较小规模的“样本”数据“学习”出输入与输出之间可能存在的某种关系模式,从而建立预测模型。类似这种机器学习算法,又被称为_________,其中用到的“样本”数据一般被称为_______。 A: 无监督学习训练数据 B: 监督学习测试数据 C: 监督学习训练数据 D: 无监督学习测试数据
- 3
模型算法中,对样本数据机器学习时,通常把数据集分为训练集和测试集()
- 4
从广义上来说,机器学习是一种通过利用数据,训练(Training)出模型,然后使用模型预测的一种方法。