【文献阅读】了解目前DL在生态学领域的应用1

文献情况
综述文章:Deepas a tool forand (2021)
大类及分区:环境科学与生态学1区
小类及分区:生态学2区
影响因子:6.0
引用格式:, M.L. et al., 2021. Deepas a tool forand .inand .
【【文献阅读】了解目前DL在生态学领域的应用1】笔记 1 生态学领域为什么需要ML/DL?
现代生物学家被数据淹没,除了基因序列,还包括样本、标本和物种的数字化信息 。设计用于考虑许多变量的机械方法的计算成本可能非常高,因此无法再应用于现代研究中常规生成的数据 。机器学习是一种很有前途的替代方法 。
2 研究现状
2.1 主要数据类型
(a)图像;
(b)视频,如果原始输入是作为运动图像收集的,即使作为单个帧处理,视频;
(c)声音,包括红外和超声波、声纳,即使作为光谱图图像进行分析;
(d)作为DNA、RNA或蛋白质序列、SNP和等位基因频谱或基因表达模式收集的分子数据;
(e)作为时间序列收集的各种格式的时间数据;
(f)作为环境的物理或生物特性收集的环境数据,存在/不存在和物种群落组成、地理位置描述符(如坐标和高程);
(g)其他数据,包括身体测量、色谱、声纳、不可见光光谱、激光雷达和其他遥感 。
2.2 主要神经网络架构
(a)密集/全连接神经网络 (DNNs),包括自组织映射;
(b)卷积神经网络 (CNNs);
(c)递归神经网络 (RNNs);

【文献阅读】了解目前DL在生态学领域的应用1

文章插图
(d)变分自动编码器(VAEs);
(e)生成对抗网络(GANs);
(f)其他,例如变压器 。
2.3 在生态和进化中的主要应用 主要应用描述
分类
目前,深度学习最常见的应用是以监督学习的方式进行识别和分类,包括从分子、图像、视频、声音或其他数据中预测各种生物实体的类别 。深度学习还可以识别、分类和随后重新识别个体动物 。深度学习也被用于从原始数据中检测和分类动物的行为,这是克服耗时且容易出错的手动标记任务的关键一步 。
回归
使用机器学习来推断种群遗传参数;深度学习与 ABC 相结合已被应用于推断人口规模随时间的变化 。
建模
早期流行的方法是使用神经网络对生态社区数据和环境变量进行无监督聚类和降维 。深度学习也用于物种分布和相互作用的建模 。强化学习用于研究资源分配等适应性问题;VAE应用于人口结构的推断和可视化;GAN用于创建已知祖先的人工人类基因组序列、模拟真实的种群遗传数据以推断种群遗传参数、人工图像增强训练数据和模拟植被演替以深入了解物种相互作用 。
结论 深度学习可以处理来自各种来源的数据,直接从原始输入中学习复杂的分层模式,并解决不存在机械解决方案的问题;深度学习在生态和进化领域最常见的应用是以监督方式进行识别和分类,未来,分类任务将进一步受益于组合来自不同来源的数据,如图像、分子数据、运动和位置传感器以及文本注释等;对复杂模式(如种群遗传结构)进行可视化和聚类的无监督方法很有前景,并且无疑将继续发展;生成性深度学习似乎是迄今为止创建复杂度接近真实生物模式的数据的最佳工具 。