2025年knn模型是什么(knn模型是什么语言)

knn模型是什么(knn模型是什么语言)KNN K Nearest Neighbor 算法 即 K 值为邻近 KNN 是最简单的分类算法之一 同时 也是最常用的分类算法之一 KNN 算法是有监督学习中的分类算法 基于基于 iris 数据集 具体经历下面四步流程 载入数据 对数据进行预处理 缺失值处理 标准化等 其中 iris 数据集数据全面

大家好,我是讯享网,很高兴认识大家。



KNN:K-Nearest-Neighbor算法,即K值为邻近。KNN是最简单的分类算法之一,同时,也是最常用的分类算法之一。KNN算法是有监督学习中的分类算法。

基于基于iris数据集,具体经历下面四步流程:
        ①载入数据,对数据进行预处理 (缺失值处理、标准化等,其中iris数据集数据全面,无需进行缺失值处理)。
        ②计算待分类点到其他每个样本点的距离。
        ③对每个距离进行排序,然后选择出距离最小的K个点。
        ④对K个点所属的类别进行比较,根据少数服从多数的原则,将待分类点归入在K个点中占比最高的那一类。



(1)对缺失值补全的方法,此处采用对缺失值填充当列数据的平均值的方法

 
  
讯享网

(2)距离计算公式,包括闵式距离(含欧式距离、曼哈顿距离和切比雪夫距离)、标准化欧式距离(排除数据量纲的影响)、余弦距离、杰卡德距离(求交集、并集间距离)、汉明距离(密码学常用,求字符串间距离)、马氏距离(求分布数据距离)。下面详细介绍闵式距离。

        闵氏距离又叫做闵可夫斯基距离,是欧氏空间中的一种测度,被看做是欧氏距离的一种推广,欧氏距离是闵可夫斯基距离的一种特殊情况。定义式:

                                                            
讯享网

闵可夫斯基距离公式中:

当时,即为欧氏距离:勾股定理计算的点之间的直接距离

                                             

当时,即为曼哈顿距离:点在标准坐标系上的绝对轴距之和

                                           

当时,即为切比雪夫距离:各坐标轴数据差的最大值

                                              

                                  

               

图中绿色代表欧氏距离,红线代表曼哈顿距离,其他三条折线也表示了曼哈顿距离,这三条折线的长度是相等的。

讯享网

运行结果:  

 


小讯
上一篇 2025-06-12 11:29
下一篇 2025-04-14 10:18

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/141540.html