论文阅读( 二 )


迄今为止,已经有一些研究回顾了监督学习的心电图分析技术[2]–[4],[27]–[30] 。然而,据作者所知,这项工作是第一个对无监督心电图分析系统进行全面且批判性的回顾 。在这项工作中,我们回顾了临床/医疗应用中的无监督心电图分析系统以及这些系统所采用的相关机器学习方法 - 从传统模型到最近的深度学习模型 。为了进行全面的回顾,我们搜索了多个平台,包括、、 、和数据库,并在著名期刊和由知名引用指数排名的会议上选择了大多数在过去十年内发表的研究 。我们讨论了这些最新研究,进行了比较,概述了它们的局限性,并提供了未来的方向 。这将使研究人员能够方便地获取所需信息,并选择适合其特定应用的适当算法 。
心电图(ECG)聚类
在应用聚类算法之前,典型的心电图(ECG)聚类流程包括几个数据准备和预处理步骤 。在本节中,我们将简要回顾用于有效聚类心电图数据的数据准备技术,包括去噪、分割和特征工程 。然后,我们将广泛回顾传统和最新的聚类算法,包括深度学习方法,并进行批判性比较 。
心电图聚类的数据准备
用于去噪、分割和特征工程的方法在很大程度上与监督学习系统中使用的方法重叠 。在这里,我们简要介绍这些技术,特别是那些专为心电图聚类量身定制的技术 。感兴趣的读者可以参考文献[2]至[4]以获取更详细的信息 。
1)去噪和伪影去除:此步骤旨在减少患者呼吸、皮肤伸展、电力线干扰和肌肉收缩的扭曲效应 。心电图去噪系统通常基于移动平均滤波器、频率选择性滤波器、维纳滤波器、自适应滤波器和离散小波变换[31] 。关于心电图去噪方法的更多信息可以在[31]中找到 。
2)分割:经过去噪处理的心电图信号通常通过自动识别心跳来分割成准周期单元 。一个心跳包括几个电波,称为P、QRS和T波,它们代表心脏房室(心房和心室)的去极化(收缩)和复极化(舒张)[32] 。
大多数心电图聚类研究会检测QRS波复合物的峰值,即R峰,并沿着信号考虑两个连续R峰之间的间隔,即整个心脏周期,作为分割单位 。很少有研究考虑了心电图信号的其他特征点用于分割[33]–[35] 。鉴于心电图周期的PR、ST和TP段的异常形态可以指示常见的心脏疾病,如心肌缺血、低钾血症和心房颤动[32],在分割中加入其他心电图特征点可以改善聚类结果 。有些研究并不是通过在心电图信号中识别心脏周期来进行分割,而是将信号分成固定的时间间隔,而不识别任何特征点[36],[37] 。还有一些心电图聚类方法不执行分割[38],[39] 。这些方法直接从心电图信号中提取特征,而不识别任何生理特征点 。
3)特征工程:这一步旨在获取心电图片段的最具信息量的特征,以促进下游的无监督学习任务 。在这里,我们简要介绍传统的心电图特征工程方法 。更近期的深度学习方法在第 II-C 节中进行了介绍 。
专业医生通常会检查 P、QRS 和 T 波的时间和幅度特征以诊断心脏疾病 。然而,心脏异常并不总是在时间域中可见[40] 。通过功率谱分析和时频分析(如小波变换)获得的心电图信号频率信息可以填补这一空白 。在小波变换中,将输入的心电图与一组称为小波的有限持续函数之间的相关性被视为心电图特征[36],[41] 。有关时域、电压域和频域特征工程方法的更多详细信息,感兴趣的读者可以参考以下来源[3],[4],[29],[30] 。
最近,受自然启发的基于群体的优化方法,如萤火虫算法和粒子群优化,也被用于特征工程[42],[43] 。这些方法搜索那些在可能特征的庞大人群中,能够在分类或聚类性能方面表现最佳的特征 。例如,Kora [42] 将心电图信号上的每个点视为可能的特征 。她使用萤火虫算法,寻找能够最大化用于将心电图片段分类为正常和心肌梗死类别的神经网络的准确性的点 。有关受自然启发的特征工程方法的更多信息,我们将读者引荐至以下来源[44]–[46] 。