论文阅读 _算法

题目
无监督心电图分析一综述
摘要
电心图（ECG）是检测异常心脏状况的黄金标准技术。自动检测心电图异常有助于临床医生分析心脏监护仪每天产生的大量数据。由于用于训练监督式机器学习模型的带有心脏病专家标签的异常心电图样本数量有限，对于心电图分析，越来越需要无监督学习方法。无监督学习旨在将心电图样本分成不同的异常类别，而无需心脏病专家提供的标签，这个过程被称为心电图聚类。除了异常检测，心电图聚类还最近发现了反映有关整个身体和思维的互和内个体模式，例如情绪、心理障碍和代谢水平等有价值的信息。心电图聚类还可以解决监督学习系统面临的特定挑战，例如不平衡数据问题，并可以增强生物识别系统。虽然已经有关于监督式心电图系统的几篇综述文章，但是关于无监督心电图分析技术的综合性综述仍然缺乏。本研究主要回顾了过去十年主要发展的心电图聚类技术。重点放在最近的机器学习和深度学习算法以及它们的实际应用上。我们对这些技术进行了批判性的回顾和比较，讨论了它们的应用和局限性，并提供了未来的研究方向。这篇综述深入洞察了心电图聚类，并提供了采用适用于特定应用的适当算法所需的必要信息。
引言
电心图（ECG）展现了心脏的电活动。它在重症监护室以及日常监测和可穿戴监护仪中常规记录，每天产生大量数据。已经开发了基于监督式机器学习的许多系统，利用心电图数据集和心脏病专家提供的标签，将心跳分类为正常和几种异常类别[1]–[5] 。然而，心脏病专家只能分析和标记大量心电图数据的一个小子集，以指示常见的心脏异常。此外，大多数带有标签的心电图数据集是在受控环境中获得的，例如医院和诊所，并且与可能出现在不同生理和病理条件下的多样化心电图模式相比，包含的样本非常有限。例如，从处于应激状态或患有糖尿病的个体获取的心电图数据的模式据显示与正常情况下获取的模式不同[6]，[7] 。因此，最近提出了几种无监督学习方法，用于分析心电图数据，而无需心脏病专家提供的标签，这个过程被称为心电图聚类。
然而，无监督的心电图分析的需求并不仅仅源于心脏病专家提供的标签的不足。实际上存在着患者之间和患者内部的心电图模式和结构，如果被发现，可以进一步揭示有关心血管系统以及整个身体和心智的宝贵信息。发现这些关系可以揭示各种健康状况的复杂机制和重要生物标志物，以及心智和身体的状态，并最终指导医生进行精细的治疗决策。值得注意的是，由于其复杂性和大量的数据，这些模式的视觉识别是不可能的。然而，这些模式可以通过聚类技术自动识别。例如，心电图聚类已经帮助研究人员，特别是在心理生理学领域，发现与不同情绪状态（如悲伤和情绪压力）、脑部疾病（如癫痫）以及嗜睡状态等相关的隐藏的心电图模式[6]，[8]，[9] 。心电图聚类还使研究人员能够发现在患有不同健康状况的患者中存在着明显的心脏异常和代谢水平差异，包括糖尿病[7]，夜间低血糖[10]，栓塞性脑卒中[11]以及动脉粥样硬化[12] 。
除了作为更广泛的知识发现系统的一部分应用之外，聚类技术，特别是基于深度学习的无监督方法，如自编码器[13]，[14]和生成对抗网络[15]，还被用于克服心电图监督学习系统面临的一些挑战，如解决不平衡数据问题[16]和低级别的个体化心电图分类器自动化[17]–[19] 。此外，心电图聚类已经在生物特征认证[20]–[23]、心电图分割[24]，[25]和从腹部心电图中提取胎儿心电图[26]方面得到了应用。