论文阅读(11)


在准确分类心电图异常方面的一个长期挑战是数据严重不平衡的问题,因为公共心电图数据集中由心脏病专家提供的标签中,绝大部分都是正常的心跳 。例如,在MIT-BIH数据集中,超过75%的标记心跳属于正常类别,而不到1%的心跳属于四个异常类别,分别是室颤、结点逸搏、房性早搏和室性逸搏 。这种不平衡的数据导致分类器在检测少数类别时性能较差 。克服这个问题的一个众所周知的技术是欠采样,其中从多数类别中随机删除样本,以使训练集平衡[129] 。然而,这种技术可能会丢失对分类任务至关重要的相关信息 。为了减少欠采样期间的信息损失,-Alarcón等人[16]使用自组织映射对MIT-BIH数据集中每个多数类别中的心跳进行了聚类 。
基于深度学习的无监督技术也被用于增强异常分类系统的自动化和性能 。Xu等人[131]通过使用贪婪无监督算法初始化每一层的权重来提高他们深度神经网络分类器的性能 。每个隐藏层被视为受限玻尔兹曼机[69],并使用对比散度算法[132]进行优化 - 这是一种用于训练基于能量的潜在模型的众所周知的无监督算法 。然后通过最小化地面实况标签与预测之间的交叉熵损失来微调整个网络 。他们在MIT-BIH数据集上使用三个特定患者和一个患者独立的实验来评估他们的方法 。他们的系统在MIT-BIH中的三名个体中分别达到了93.1%、94.7%和99.9%的准确率 。在患者独立实验中,他们的系统在看不见的患者中也表现出良好的泛化能力,但准确率较低,为91.8% 。
患者特定的心电图分类器 - 经过训练并在给定患者的心电图上进行微调的分类器 - 在表现上已经显示出优越性,相比于在通用心电图池上训练的分类器 。Zahi等人[17]表明,重新调整分类器以适应患者特定的正常心跳可以改善在MIT-BIH上的分类性能 。尽管它们的性能更好,但是患者特定的分类器具有较低的自动化水平,因为它们需要手动标记部分心电信号以进行微调 。为了解决这个问题,Zahi等人[17]提出了一种无监督方法来自动识别正常的心电图心跳 。他们基于心跳与相邻心跳的相似性对心跳进行了聚类,并确定了在集群中表现出最高平均相似性的心跳为正常心跳 。然后,在确定的正常心跳上微调他们的深度分类器 。他们的系统在检测两种异常类别,即室性和室上性异位心跳时表现出色,分别获得了97.4%和98.6%的高准确率 。
近年来,生成对抗网络(GAN)[15]也被用于提高患者特定分类器的自动化水平 。这个想法是利用GAN中的生成器来生成新的患者特定正常心跳 。Zhou等人[18]使用了经过GAN生成的正常心跳增强了MIT-BIH数据集,以便更准确地训练和分类室性和室上性异位心跳,从而达到了97%的总体准确率 。类似地,等人[19]在每个患者的未标记心电数据的前几分钟上训练了一个GAN来生成正常心跳 。与Zhou等人[18]使用卷积神经网络进行心律失常分类相反,他们使用了长短时记忆神经网络[133],并取得了类似的良好表现 。
基于深度学习的无监督特征提取技术还提高了与使用手工制作特征的分类器相比的监督分类系统的性能 。例如,等人[68]将基于CNN的深度自动编码器作为无监督特征提取技术与深度神经网络结合,用于心律失常分类 。他们的系统在整个MIT-BIH数据集上达到了高的F1分数0.92 。
将无监督学习与监督ECG分类相结合的另一个优势是使用迁移学习[134] 。其核心思想是将在大型数据集上训练的模型参数转移到另一个模型上,以在较小的数据集上进行分类,该数据集可能存在不准确的标签或缺失一些标签 。等人[135]在数据集[137]上训练了一个深度残差网络分类器[136](这是最大的公开可用的包含11,000名患者的ECG数据集),然后在/CinC 2017数据集[138]上微调了他们的网络,以用于房颤检测 。Jang等人[139]在超过两百万个ECG样本上预训练了一个卷积自动编码器 。然后,他们在另一个包含一万份12导联ECG的数据集上微调了他们的网络,以检测11种心律失常类别,并实现了0.857的F1分数 。