论文阅读( 十 )


最后,与研究探究心电图与心理状态之间关系的研究类似,提取的心电图特征也仅限于RR间隔和心率 。因此,有必要研究应用其他时间域、电压域和频率域特征 。
基于心电图的生物特征认证和识别
生物特征认证是根据个体的生理特征进行身份验证的过程,主要包括指纹和面部 。指纹和面部模式容易受到外部攻击,因为它们的物理特征容易被暴露 。然而,基于心电图的认证系统很难被欺骗,因为心脏电活动的基本生物特征是隐藏的 。
基于心电图的认证系统面临的挑战之一是个体内变异性,这是由于不同的个体的身体和精神状态的不同,可能导致认证失败 。一些研究旨在通过聚类分析提高基于心电图的认证系统对个体内变异性的稳健性 。其思想是将个体的心电图(或心跳)划分为不同条件下的簇,例如个体处于不同的精神或生理状态,并使用关于簇的信息,如簇的中心,作为用于执行认证的监督学习方法的附加特征 。大多数在这个应用中的研究使用了他们在不同情绪或压力水平下记录的心电图数据集 。与其评估所得到的簇的质量不同,分类指标,如灵敏度、特异性和F1分数,被用于评估下游的监督认证任务的性能 。由于在这个应用中大多数情况下无法得知地面真实的簇,可以进一步使用评价簇间和簇内相似性的指标,如轮廓分数,来提高这些研究的可靠性 。
作为一个现代研究的例子,Zhou等人 [23] 使用了高斯混合模型聚类来提高主体在压力下的认证系统的稳健性 。特别地,他们将主体的心电图划分为几个不同压力水平的群组 。这些簇的中心结合由卷积自编码器学习的心电图的潜在表示,被作为输入特征向量提供给执行认证的支持向量机 。他们在23名不同压力条件下的健康受试者上测试了他们的系统,并取得了平均识别率为95%和平均F1分数为0.97的结果 。
与认证类似,生物识别鉴定是基于个体的生物特征在先前识别的模板数据库中进行身份识别的过程 。基于心电图的识别系统通常由于需要将给定的心电图与数据库中存储的所有模板心电图进行交叉匹配以找到匹配而产生高计算成本 。聚类通过对模板心电图进行聚类,帮助降低了此类系统的计算成本 。在识别过程中,只搜索与给定心电图信号最相似的簇的中心 。等人 [126] 使用K-means将50000个心电图数据库中的模板划分为五个簇 。在识别过程中只搜索最相似的簇,他们将识别时间缩短了79.26% 。在类似的方法下,Sufi等人 [127] 提出了一种基于压缩心电图数据的识别系统 。压缩心电图数据通常在无线心血管监测中需要使用 。然而,解压数百万个压缩心电图信号非常耗时 。为了解决这个问题,Sufi等人设计了一个基于高斯混合模型的系统,直接对模板心电图数据库中的压缩心电图信号进行聚类 。
这些研究采用的聚类算法主要受限于K-means和GMM 。因此,需要进一步研究用于心电图聚类的其他聚类算法,如 [53] 和基于深度学习的方法 。针对基于心电图的鉴定系统的数据集非常小(n < 30),需要一个更大的心电图数据集,记录不同情绪或压力水平下的数据,以进一步提高对个体内变异的鲁棒性 。还需要研究开发能够检测心电图与其他生理信号同步性的聚类算法 [128] 。
改进监督异常分类
除了知识发现,聚类和基于深度学习的无监督技术也可以用于改进心电图分类系统的性能并克服挑战 。在这个应用中,所识别的聚类质量很少被评估 。相反,常常使用分类指标,如敏感性、特异性和 F1 分数,来评估下游的分类任务性能 。然而,由于已知地面实况聚类,上述的分类指标以及相似性指标,如 NMI 和系数,可以用于评估聚类阶段的性能,并提高这些研究的可靠性 。MIT-BIH 数据集在这个研究领域中被广泛使用 。由于这个数据集相对较小,未来的工作也应该着重使用更大的数据集,比如由Zheng等人[112]和等人[113]收集的数据集 。