- 人工智能与中医信息技术导论(全国中医药行业高等教育“十四五”创新教材)
- 唐文超主编
- 2854字
- 2024-07-03 16:04:11
二、图像处理
(一)图像数字化
图像是人对视觉感知的物质再现。根据记录方式的不同,图像可分为模拟图像和数字图像。模拟图像是通过光、电等物理量的强弱变化来记录图像的亮度信息,如绘画、打印的照片。数字图像则是以二维矩阵形式表示的图像,是可以被计算机存储和处理的图像。本节讨论的对象为数字图像。
我们将图像按行和列分割成m×n个网格,每个网格就是一个色块,再用不同的数字来表示每个色块中的颜色,图像即被转换为一个由数字组成的矩阵。这里的网格我们称之为像素,网格的行数和列数即为分辨率。图像分为灰度图像和彩色图像。灰度图像只有明暗的区别,我们使用0到255之间的整数来表示明暗程度不同的灰色,0代表最暗的黑色,255则代表最亮的白色。对于彩色图像,我们采用RGB颜色模型,即(R,G,B)三个数字来表示一个像素中的颜色。而三种颜色分量的明暗程度同样用0到255之间的整数表示。数字越大,表明该基本颜色的比例越大,比如(0,255,0)表示纯绿色,(0,0,255)表示纯蓝色。
(二)图像处理与其技术实现
数字图像处理是利用计算机进行图像数据分析,对图像进行噪声去除、质量增强、复原、目标检测与分割、类型识别、重建等处理的方法和技术。近年来,得益于人工智能技术的突破,图像处理技术快速发展,并在医学领域展现出了巨大的应用价值与前景。图像处理涉及多种不同方法和技术,其在医疗领域主要用于解决图像分类、目标检测、图像分割等任务。
图像分类是为给定图像输出一个或多个类别标签,是图像处理中最常见的任务之一。目标检测、图像分割等任务都与分类有着密不可分的关系。目标检测需要确定目标在图像中的位置,并对其所属类别进行判断,即从图像级别的分类拓展到单个物体的分类。而图像分割则需要将分类问题拓展到像素级别,将图像划分为多个子区域。在一定程度上来说,目标检测和图像分割是分类任务的延伸与拓展。因此,这里以图像分类为例,介绍其实现过程。
简单来说,图像分类通过手工特征或特征学习方法对整个图像进行全部描述,计算机提取图像不同层级的特征,综合考虑后输入分类器进行判别,实现对图像的分类。
特征是某类对象能够区别于其他对象的特点或特性。对于图像而言,每幅图像都具有能够区别于其他类图像的自身特征,如边缘、纹理、色彩等。为了使计算机能够理解图像,就需要将这些图像特征转换成数值、向量等计算机能够读懂的描述。目前,研究人员已经设计出多种不同的算法来提取图像特征,如方向梯度直方图被用来描述物体轮廓,局部二值模式被用来描述图像局部纹理。然而人为设计的特征较难直接传达图像中所蕴含的高层次抽象概念,因此,面对复杂图像时,识别效果欠佳,并且十分依赖经验。如今,随着深度学习的广泛应用,图像识别已进入一个更加智能的阶段。
深度神经网络能够替代人工,通过有监督或无监督的方式学习层次化的特征描述,从而取代了手工设计或选择图像特征的工作,实现复杂图像的识别。通常,一个深度神经网络模型由多层网络组成,模型可以直接读取图像的像素信息,不同层级的网络负责不同抽象程度的特征提取,输出层直接输出识别的结果。这种端到端的方法也最大限度地保留了图像的所有信息,不同层级提取的图像特征还可用于计算机视觉相关的其他任务。
深度神经网络需要通过训练才能学习出有效的图像特征。训练的本质是通过损失函数驱动模型寻找最佳参数。随着神经网络层数的增加,需要训练的参数也在增加。在2012年Image Net图像识别挑战赛上,冠军团队所创建的深度神经网络Alex Net需要学习的参数高达6000万个。因此,开发高效的优化算法也是深度学习的重要任务之一。反向传播算法是训练神经网络最常见的策略之一,该方法对网络中所有权重计算损失函数的梯度。神经网络对训练图像进行逐层计算后,会输出图像属于某一类的预测概率,通过损失函数计算预测结果与正确答案之间的差异,然后根据梯度方向逐层调整神经网络的参数,优化预测结果。
(三)图像处理在医疗领域的应用场景
1.AI医学影像的应用 AI医学影像是指将人工智能技术应用于医学影像的诊断。主要是通过计算机视觉领域的相关技术,挖掘海量医学影像中的数据与信息,学习、模拟医生的诊断思路,输出诊疗判断结果。
我国的医学影像数据年增长率为30%,然而影像科医生的年增长率仅为4%。巨大的人员缺口加重了医生的工作负荷,因此,市场对AI医学影像的需求迫切。AI医学影像的引入,不仅能够改善人员不足的情况,缓解医学影像诊断的压力,还能够提升医生的诊断质量,帮助基层医生提升对复杂图像的诊断能力,推进分级诊疗体系的完善。
目前,AI医学影像主要有病灶识别与标注,靶区自动勾画和自适应放疗,以及三维图像重建三个应用场景。病灶识别与标注是通过对X线、CT、MRI等图像进行分析以鉴别并标注出病灶,帮助医生提高读片效率,降低假阴性率。靶区自动勾画和自适应放疗是指对肿瘤放疗区域的精准勾画,并在治疗过程中持续地监测病灶位置的变化,实现自适应放疗,以减少射线对健康组织的危害。三维图像重建是将二维断层图像转化为三维图像,可用于疾病诊断、手术方案设计等领域,有利于提高医疗规划的精准性。
AI医学影像产品的布局方向主要集中在胸部、头部、四肢关节、盆腔等部位,以肿瘤和慢性疾病的筛查为主。肺结节和眼底筛查是发展较早的领域,近年来,与乳腺癌、骨龄和骨折、皮肤病、脑卒中、冠状动脉等疾病相关的产品也逐渐成熟。新冠疫情期间,多家公司推出了针对新型冠状病毒感染的人工智能辅助诊断系统,协助医生快速准确地从CT影像中检测病变,成为抗疫中提升诊断效率的关键力量。目前,已有多款AI医学影像产品获得了国家药品监督管理局颁发的三类医疗器械注册证。AI医学影像产品逐步落地应用标志着AI医学影像进入了一个新时代。
2.图像处理在中医药领域的应用 中医药传承千年,以其独特的理论体系和丰富的临床经验对西医学进行丰富与补充。随着AI技术与医疗领域的深度融合,图像处理在中医药领域的应用研究也取得了长足进步,助力着中医的智能化与现代化。
智能化中医望诊——望诊居于四诊之首,望诊中对面部、舌和手掌的观察,能为疾病的诊断提供有力依据。而利用图像识别技术,对患者的外部特征加以提取,则可捕捉到不易被人察觉的身体特征,有利于望诊的标准化和客观化。目前,基于中医图像的疾病智能诊断是一个研究热点。前期的工作多基于面部、舌、手掌等体表特征,实现对舌色、面色、体质识别,以及证候辨别和疾病诊断。在此基础上,一些研究还聚焦于挖掘望诊信息和中医处方之间的关系,以实现中医处方的自动化生成。
智能化中草药识别与鉴定——中草药作为中医学的重要组成部分,在疾病的预防与治疗中有着卓越的表现,同时,也是药理与药物研发的重要来源。然而,中草药种类繁多复杂,部分药材的形状、颜色等特征又极其相似,非专业人士难以识别。更有甚者,部分厂商为追求丰厚的利益,以假乱真,以次充好,不仅给中药材的识别与鉴定带来了困难,而且危害了患者用药的安全性和有效性。利用图像识别技术,可以精准快速地帮助低年资医生和消费者鉴别药材的种类、真伪、质量,保障用药安全,提升中医药在健康领域的贡献度。