Python k-近邻算法常见问题-千锋教育

校区

首页课程师资教程资讯关于

校区精品课程

互联网前瞻热门课程从入门到成神

鸿蒙生态开发 HTML5培训 Java培训 Python培训云计算培训软件测试培训网络安全培训大数据培训物联网培训 Unity培训全媒体营销培训影视剪辑培训游戏原画培训区块链培训商业插画培训产品经理培训

全国旗舰校区

不同学习城市同样授课品质

北京

深圳

上海

广州

郑州

大连

武汉

成都

西安

杭州

青岛

重庆

长沙

哈尔滨

南京

太原

沈阳

合肥

贵阳

济南

下一个校区
就在你家门口 +

培训课程
师资团队
关于千锋

培训机构
面试题
就业前景

零基础学IT

当前位置：首页 > 技术干货

Python k-近邻算法常见问题

发布时间:2023-11-08 00:04:00

发布人:xqq

1，K值设定为多大?

K太小，分类结果易受噪声点影响;K太大，近邻中又可能包含太多的其他类别的点。(对距离加权，可以降低K值设定的影响)

K值通常是采用交叉检验来确定

经验规则：K一般低于训练样本数的平方根

2，类别如何判断最合适?

投票法没有考虑近邻的距离远近，距离更近的近邻也许更应该决定最终的分类，所以加权投票法更加恰当一些。

3，如何选择合适的距离衡量?

高维度对距离衡量的影响：众所周知当变量数越多，欧氏距离的区分能力就越差。

变量值域对距离的影响：值域越大的变量常常会在距离计算中占据主导作用，因此应当对变量进行标准化。

4，训练样本是否要一视同仁?

在训练集中，有些样本可能是更值得依赖的

可以给不同的样本施加不同的权重，加强依赖样本的权重，降低不可信赖样本的影响。

5，性能问题?

KNN是一种懒惰算法，平时不好好学习，考试(对测试样本分类)时才临阵磨枪(临时找k个近邻)。

懒惰的后果：构造模型很简单，但是对测试样本分类的系统开销很大，因为要扫描全部训练样本并计算距离。

已经有一些方法提高计算的效率，例如压缩训练样本量等。

6，能否大幅度减少训练样本量，同时又保持分类精度?

浓缩技术(condensing)

编辑技术(editing)

以上内容为大家介绍了Pythonk-近邻算法常见问题，希望对大家有所帮助，如果想要了解更多Python相关知识，请关注 IT培训机构:千锋教育。

python培训

上一篇基于 Python K-近邻算法的手写识别系统

下一篇Python k-近邻算法的实现原理

相关文章

python 粘包解决方法

python 粘包解决方法

python 选择排序

python 选择排序

python 插入排序

python 插入排序

python 归并排序

python 归并排序

最新文章

武汉新媒体行业公司排名

武汉新媒体行业公司排名

武汉新媒体就业现状好吗

武汉新媒体就业现状好吗

武汉全媒体行业发展现状及趋势

武汉全媒体行业发展现状及趋势

武汉全媒体现状

武汉全媒体现状

热门频道

IT培训机构

培训费用、培训周期你关心的都有

就业前景

学会能干什么，IT培训就业前景介绍

零基础学习

零基础学习IT，大神也是零基础起步

面试题

常见经典面试题及答案解析

千锋问问

搜集常见技术关键点，高效答疑

网站地图

明晰网站布局，快速定位学习内容

在线咨询免费试学教程领取