状态函数的含义及其基本特征是什么,态函数的特点是什么( 五 ) _生活百科

【状态函数的含义及其基本特征是什么,态函数的特点是什么】将核函数形式化定义，如果原始特征内积是，映射后为，那么定义核函数(Kernel)为
到这里，我们可以得出结论，如果要实现该节开头的效果，只需先计算，然后计算即可，然而这种计算方式是非常低效的。比如最初的特征是n维的，我们将其映射到维，然后再计算，这样需要的时间。那么我们能不能想办法减少计算时间呢?
先看一个例子，假设x和z都是n维的，
展开后，得
这个时候发现我们可以只计算原始特征x和z内积的平方(时间复杂度是O(n))，就等价与计算映射后特征的内积。也就是说我们不需要花时间了。
现在看一下映射函数(n=3时)，根据上面的公式，得到
也就是说核函数只能在选择这样的作为映射函数时才能够等价于映射后特征的内积。
再看一个核函数
对应的映射函数(n=3时)是
更一般地，核函数对应的映射后特征维度为。(这个我一直没有理解) 。
由于计算的是内积，我们可以想到IR中的余弦相似度，如果x和z向量夹角越小，那么核函数值越大，反之，越小。因此，核函数值是和的相似度。
再看另外一个核函数
这时，如果x和z很相近( )，那么核函数值为1，如果x和z相差很大( )，那么核函数值约等于0 。由于这个函数类似于高斯分布，因此称为高斯核函数，也叫做径向基函数(Radial Basis Function 简称RBF) 。它能够把原始特征映射到无穷维。
既然高斯核函数能够比较x和z的相似度，并映射到0到1，回想logistic回归，sigmoid函数可以，因此还有sigmoid核函数等等。
下面有张图说明在低维线性不可分时，映射到高维后就可分了，使用高斯核函数。
来自Eric Xing的slides
注意，使用核函数后，怎么分类新来的样本呢?线性的时候我们使用SVM学习出w和b，新来样本x的话，我们使用来判断，如果值大于等于1，那么是正类，小于等于是负类。在两者之间，认为无法确定。如果使用了核函数后，就变成了，是否先要找到，然后再预测?答案肯定不是了，找很麻烦，回想我们之前说过的
只需将替换成，然后值的判断同上。