内核方法是一类用于模式分析或识别的算法,其最知名的使用是在支持向量机(SVM)。模式分析的一般任务是在一般类型的数据(例如序列,文本文档,点集,向量,图像等)中找到并研究一般类型的关系(例如聚类,排名,主成分,相关性,分类)图表等)。内核方法将数据映射到更高维的空间,希望在这个更高维的空间中,数据可以变得更容易分离或更好的结构化。对这种映射的形式也没有约束,这甚至可能导致无限维空间。然而,这种映射函数几乎不需要计算的,所以可以说成是在低维空间计算高维空间内积的一个工具。
LR和SVM可能是面试中问到的非树模型中很常见的一个问题了,主要的是推公式以及说明求解过程如SVM。笔者在面美团的时候就要求推了LR和SVM,过程不难,平时每天推一遍,你就会发现面试的时候最让人觉得愉快的就说推公式了,然后推完之后就是问一下与之有关的乱七八糟的问题了。
1、非线性!!!!逻辑回归属于广义线性模型,表达能力有限,单变量离散化为N个后,每个变量有单独的权重,相当于为模型引入了非线性,能够提高模型表达力,加大拟合, 离散特征的增加和减少都很容易,易于模型的快速迭代。
完整的机器学习项目主要步骤:1、明确问题,首先要划定问题:监督或者非监督,还是强化学习?这是个分类任务、回归任务还是其他的?
在k-means或kNN,我们常用欧氏距离来计算最近的邻居之间的距离,有时也用曼哈顿距离,请对比下这两种距离的差别 欧氏距离,最常见的两点之间或多点之间的距离表示法,又称之为欧几里得度量,它定义于欧几里得空间中..