Header Image - 数据科学与编程

sklearn数据集简介

一:数据集划分机器学习一般的数据集会划分为两个部分:1、训练数据:用于训练,构建模型。(大家有时也会看到把训练数据划分为训练集和验证集,这往往发生在模型需要交叉验证时,目的是为了寻找更为合适的模型参数)2、测试数据:在模型检验时使用,用于评估模型是否有效

75 views

KNN算法

K-近邻算法原理
K最近邻(kNN,k-NearestNeighbor)分类算法,见名思意:
找到最近的k个邻居(样本),在前k个样本中选择频率最高的类别作为预测类别,什么?怎么那么拗

252 views