机器学习之KNN（k近邻）算法详解

机器学习入门：KNN算法详解与应用

最新推荐文章于 2025-09-05 12:03:34 发布

平原2018

最新推荐文章于 2025-09-05 12:03:34 发布

阅读量10w+

点赞数 243

CC 4.0 BY-SA版权

分类专栏：算法文章标签： KNN

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sinat_30353259/article/details/80901746

算法专栏收录该内容

42 篇文章 ¥9.90 ¥99.00

订阅专栏

超级会员免费看

本文详细介绍了机器学习中的KNN（k近邻）算法，包括其基本流程、距离度量方法（如欧式距离、曼哈顿距离等）、k值选择的影响以及kd树的概念和构造方法。KNN算法简单有效，适用于大样本自动分类，但也存在过拟合、计算量大等问题。通过选择合适的k值和利用kd树可以优化搜索效率。

文章目录

1-1 机器学习算法分类

一、基本分类：

①监督学习（Supervised learning）

数据集中的每个样本有相应的“正确答案”，根据这些样本做出
预测，分有两类：回归问题和分类问题。

步骤1：数据集的创建和分类
步骤2：训练
步骤3：验证
步骤4：使用

（ 1）回归问题举例
例如：预测房价，根据样本集拟合出一条连续曲线。
（ 2）分类问题举例
例如：根据肿瘤特征判断良性还是恶性，得到的是结果是“良性”或者“恶性”，是离散的。

监督学习：从给定的训练数据集中学习出一个函数（模型参数），当新的数据到来时，可以根据这个函数预测结果。监督学习的训练集要求包括输入输出，也可以说是特征和目标。训练集中的目标是由人标注的。
PCA和很多deep learning算法都属于无监督学习

②无监督学习

无监督学习：输入数据没有被标记，也没有确定的结果。样本数据类别未知，需要根据样本间的相似性对样本集进行分类（聚类， clustering）试图使类内差距最小化，类间差距最大化。
实际应用中，不少情况下无法预先知道样本的标签，也就是说没有训练样本对应的类别，因而只能从原先没有样本标签的样本集开始学习分器设计

了解本专栏

超级会员免费看

评论 16

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

平原2018 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。