状态函数的含义及其基本特征是什么,态函数的特点是什么( 五 )


【状态函数的含义及其基本特征是什么,态函数的特点是什么】将核函数形式化定义,如果原始特征内积是 ,映射后为 ,那么定义核函数(Kernel)为
到这里,我们可以得出结论,如果要实现该节开头的效果,只需先计算 ,然后计算 即可,然而这种计算方式是非常低效的 。比如最初的特征是n维的,我们将其映射到 维,然后再计算,这样需要 的时间 。那么我们能不能想办法减少计算时间呢?
先看一个例子,假设x和z都是n维的,
展开后,得
这个时候发现我们可以只计算原始特征x和z内积的平方(时间复杂度是O(n)),就等价与计算映射后特征的内积 。也就是说我们不需要花 时间了 。
现在看一下映射函数(n=3时),根据上面的公式,得到
也就是说核函数 只能在选择这样的 作为映射函数时才能够等价于映射后特征的内积 。
再看一个核函数
对应的映射函数(n=3时)是
更一般地,核函数 对应的映射后特征维度为。(这个我一直没有理解) 。
由于计算的是内积,我们可以想到IR中的余弦相似度,如果x和z向量夹角越小,那么核函数值越大,反之,越小 。因此,核函数值是 和 的相似度 。
再看另外一个核函数
这时,如果x和z很相近( ),那么核函数值为1,如果x和z相差很大( ),那么核函数值约等于0 。由于这个函数类似于高斯分布,因此称为高斯核函数,也叫做径向基函数(Radial Basis Function 简称RBF) 。它能够把原始特征映射到无穷维 。
既然高斯核函数能够比较x和z的相似度,并映射到0到1,回想logistic回归,sigmoid函数可以,因此还有sigmoid核函数等等 。
下面有张图说明在低维线性不可分时,映射到高维后就可分了,使用高斯核函数 。
来自Eric Xing的slides
注意,使用核函数后,怎么分类新来的样本呢?线性的时候我们使用SVM学习出w和b,新来样本x的话,我们使用 来判断,如果值大于等于1,那么是正类,小于等于是负类 。在两者之间,认为无法确定 。如果使用了核函数后, 就变成了 ,是否先要找到 ,然后再预测?答案肯定不是了,找 很麻烦,回想我们之前说过的
只需将 替换成 ,然后值的判断同上 。