干货 :时间序列异常检测( 四 )


干货 :时间序列异常检测

文章插图
针对非数值型的方法
之前介绍的大多数异常检测算法都是处理数值类型的数据 , 那么处理 类型的数据 , 有没有什么好的算法? value算法 , 就是非常有效的一种 。
AVF算法全称 Value  , 针对非数值型的数据 , 即类别离散数据的方法 。具体步骤如下:
将所有的数据点都标为非异常点;
计算所有每一个属性值的频数;
计算每一个点的AVF score , 即样本点x的每一个属性值对应的频数之和除以属性总数 , 当然这里的属性指的都是 的属性 。
值越小 , 样本越异常 。
03
开源异常检测系统
这里帮大家列举一些常用的异常检测算法包 , 有Java版本、R版本 , 供各位同学参考使用
04
总结
其实可以看到 , 以上方法的分类之间也是相近的 。说到底 , 概率、密度和聚类也是由空间中的数据点之间的距离所决定的 。而本文主要是想记录基于时间序列的异常检测方法 。当然 , 以上方法在时间序列抽取后的特征空间中也能够使用 。