生物医学工程学杂志

卷积神经网络在生物医学图像上的应用进展

 

生物医学是综合生命科学、生物学和医学发展起来的一门前沿交叉学科,通过生物学、医学及工程技术手段研究和解决生命科学及医学中的问题,从而提高医疗诊断技术,改善人类健康水平。成像技术是生物医学中的核心技术之一,其应用主要包括生物学图像和医学图像两个方面。研究者借助不同级别的图像来分析研究从细胞到个体各个层次的问题。近年来,随着成像技术不断发展,一方面新的成像方式不断出现,另一方面图像在空间和时序上的分辨率在不断提升,这不仅使得生物医学图像在数量上急剧增加,也使得图像中的信息量爆炸式增长。然而,能够对图像进行分析和解读的相关技术人员并没有显著增加,爆炸增长的图像信息将相关技术人员和医师淹没在重复枯燥的分析图像的工作中,无法真正从事有效的信息归纳分析工作。因此,对生物医学图像的自动分析就显得越来越重要。

深度学习(Deep Learning,DL),尤其是卷积神经网络(Convolutional Neural Networks,CNN)技术近年来迅速发展,为生物医学图像的自动分析提供了有力的工具。近些年,伴随计算机硬件的发展,CNN在处理图像的速度、精度方面都在不断提升,其在处理生物医学图像方面的优势也尤为凸显。一方面,CNN 对原始图像直接进行学习,避免了传统算法复杂的特征提取和参数设置;另一方面,CNN避免了全连接神经网络的空间信息丢失问题,又采用局部感受野及权重共享机制解决了参数过多的问题。由于其上述优势,CNN 模型在计算机视觉领域的应用发展迅速并取得显著成果。例如,在最近的新冠肺炎中,多款基于CNN 模型实现的新冠肺炎“CT+AI”辅助诊断系统落地,在此次抗击疫情中发挥了有效的作用,极大地减轻了医院和医生的负担。

近年来,随着CNN 模型的发展,涌现出大量利用CNN模型进行生物医学图像分析的方法。之前已有相关文献对CNN 网络在图像处理中的应用进行了归纳,如梁蒙蒙等[1]以CNN的发展历史为主线讲述了CNN模型的各种改进方法,并简要提及了CNN 在医学图像上的应用。Shen 等[2]与Litjens 等[3]分别针对2017 年以前DL 在医学方面的应用进行了调研与总结。然而,一方面,随着近年来CNN网络架构的不断发展,其在生物学和医学中的应用也取得了不少进展。从2017到2019年底,在Web of Science 上共检索到31 274 篇文章利用CNN 技术对生物医学图像进行处理,其中11 202 篇针对细胞生物学图像以及20 072 篇针对医学图像(如图1)。另一方面,以上文章主要侧重于总结CNN 在医学图像方面的应用,没有对其在生物学图像中的应用进行总结。生物学图像在生物医学研究中起到重要作用,也存在与医学图像分析相似的挑战,例如数据量大、精度要求高等。将CNN在生物学和医学图像中的应用放在一起讨论可对其在生物医学领域的进展有更全面的了解。因此,对近年来该领域的研究成果进行了调查研究和梳理总结,一方面帮助生物医学领域研究者了解CNN 模型在生物医学图像中可以解决的问题、能达到的效果等;另一方面帮助算法开发者了解CNN 在生物医学领域的主要应用领域、可用的数据集,以及面临的挑战等。

在后面的文章中,首先简要介绍CNN 的发展历史和它的结构和原理,之后着重从细胞生物学图像和医学影像两个方面对CNN 在生物医学图像中的研究成果进行梳理总结。最后,试着提出目前CNN 在生物医学图像研究中存在的问题,并对今后的发展方向进行展望。

1 卷积神经网络发展简介

本章首先回顾早期神经元模型到CNN模型的发展历程(如图2),然后重点分析CNN 模型架构设计、应用设计和评估方法。

1.1 CNN模型简介

CNN 模型由早期的人工神经网络发展而来,使用卷积操作解决了人工神经网络计算量大和结构信息丢失的缺点。1982 年,为模拟人类视觉认知功能,Fukushima 等[4]提出神经认知机(neocognitron)的概念,这被认为是CNN的起点。1989年,LeCun等[5]构建起最初的LeNet 模型,其包含卷积层、全连接层。经过改进,1998年,LeCun 等[6]提出了经典的LeNet-5 模型,较好地解决了手写数字识别问题。该模型已经包含了现代CNN网络的全部基本模块:卷积层、非线性激活层、池化层、全连接层。

卷积层是CNN 模型的核心,具有局部连接和权重共享的特性,其作用是通过卷积核对数据进行特征提取,抽象出更高层次的特征。非线性激活函数则增加了模型的非线性,极大地丰富了模型的表达能力。池化层对特征图进行了压缩,一方面增大了感受野,使得模型具有一定的平移、旋转不变性;另一方面,也降低了优化难度和计算量。全连接层在CNN模型末端将提取到的特征映射到样本标签上,起到分类器的作用。

上一篇:血管内皮生长因子与缺血性结肠炎相关性
下一篇:没有了