文章目录
1-1 机器学习算法分类
一、基本分类:
①监督学习(Supervised learning)
数据集中的每个样本有相应的“正确答案”, 根据这些样本做出
预测, 分有两类: 回归问题和分类问题。
步骤1: 数据集的创建和分类
步骤2: 训练
步骤3: 验证
步骤4: 使用
( 1) 回归问题举例
例如: 预测房价, 根据样本集拟合出一条连续曲线。
( 2) 分类问题举例
例如: 根据肿瘤特征判断良性还是恶性,得到的是结果是“良性”或者“恶性”, 是离散的。
监督学习:从给定的训练数据集中学习出一个函数(模型参数), 当新的数据到来时,可以根据这个函数预测结果。监督学习的训练集要求包括输入输出,也可以说是特征和目标。训练集中的目标是由人标注的。
PCA和很多deep learning算法都属于无监督学习
②无监督学习
无监督学习:输入数据没有被标记,也没有确定的结果。样本数据类别未知, 需要根据样本间的相似性对样本集进行分类(聚类, clustering)试图使类内差距最小化,类间差距最大化。
实际应用中, 不少情况下无法预先知道样本的标签,也就是说没有训练样本对应的类别,因而只能从原先没有样本标签的样本集开始学习分器设计
机器学习入门:KNN算法详解与应用
本文详细介绍了机器学习中的KNN(k近邻)算法,包括其基本流程、距离度量方法(如欧式距离、曼哈顿距离等)、k值选择的影响以及kd树的概念和构造方法。KNN算法简单有效,适用于大样本自动分类,但也存在过拟合、计算量大等问题。通过选择合适的k值和利用kd树可以优化搜索效率。
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



