首页 >> 国内研究 >

为生物医学成像构建大数据集是非常困难的

2022-06-01 09:32:11 来源: 用户: 

如果肿瘤细胞是刚生成的,就可以准确地“拔”出来,这将给肿瘤的诊断和治疗带来巨大的变革。为了实现这一点,成像方法必须具有极高的灵敏度。

最近,中国科学院自动化研究所和中国科学院分子影像重点实验室在基于人工智能(AI)技术的新成像方法研究方面取得了突破。3354研究人员将小鼠颅内胶质瘤的三维定位精度从传统方法的百微米误差降低到十微米,为疾病动物模型乃至临床患者的影像学研究提供了新思路。相关研究论文已发表在《光》期刊上。

“图像不是凭空获得的,而是通过成像设备获得的。传统方法通常不能提供最佳的成像质量。在人类识别图像之前,在将成像信号转化为图像的过程中会丢失大量关键信息,而人工智能技术可以突破这一瓶颈。”论文第一作者、中国科学院自动化研究所副研究员王坤告诉《中国科学报》,通过建立新的AI模型,可以将原始的物理信号转化为更准确、更高分辨率、更少伪影和更高信噪比的高质量图像,“人脑”和“机器脑”都可以得到更好的识别、识别和学习。这是这项研究带来的最本质的创新。

非常具有挑战性的工作。

肿瘤的早期发现并不容易,尤其是一些恶性肿瘤,潜伏期甚至长达20年。当身体发出警报时,往往已经到了中晚期。如何实现早期微小肿瘤的准确检测,及时观察肿瘤细胞刚出现时产生的一些特定蛋白质、酶甚至RNA,一直是科学家探索和研究的方向。

“然而,在真实的物理世界中,能够提供如此高灵敏度的成像介质并不多。”王坤坦言,目前公认最好的是高能伽马射线和无辐射光子,但基于伽马探测的放射性核素成像成本高,难以普及;光学成像成本低,但大多是2D图像,缺乏三维信息。

“我们用人工智能解决的是光学成像难以三维量化的问题。”王坤说,“也就是说,我们不仅可以高灵敏度地看到是否有肿瘤,是什么样的分子肿瘤,还可以高精度地知道肿瘤在哪里,有多大。”

王坤所说的光学成像是指生物自发光层析成像技术,是生物医学成像的重要手段,广泛应用于疾病动物模型的成像研究。然而,由于光子在生物体内的非均匀高散射和高吸收的物理特性,通过检测动物表面的发光斑来重建生物体内的光源位置(即肿瘤位置)是一项具有挑战性的任务。

清华大学医学院生物医学工程系研究员罗告诉《中国科学报》,以前光学层析重建的问题大多是基于模型的,包括正反问题的求解。一般用辐射传递方程或扩散方程模拟光子在组织中的传播过程来求解正问题,进而得到系统矩阵。大部分反问题都是通过一些优化方法来求解,以获得光源在体内的具体信息,如位置、形状、强度等。

“然而,这种基于模型的方法必然会受到模型近似的影响,从而导致重建精度的降低。”罗强调。据了解,正问题和逆问题的求解中两种误差的叠加,最终导致光学层析成像对动物体内肿瘤的三维定位存在几百微米到一毫米的误差。

机器学习带来突破。

为了减少误差,王坤的团队提出了基于机器学习的AI重建:完全抛弃描述光子在生命体中传播的正向模型,建立大量的模拟数据集来确定动物体表的光斑和体内的光源然后通过这个数据集训练计算机智能学习体表光斑与体内光源的非线性关系,从而构建出适合生物自发光层析成像的AI模型,最终在活体动物的荷瘤模型中重建出肿瘤的三维分布。

“本研究首次将机器学习中的多层感知器方法应用到光学层析重建中,提出了自己的数据集构建方法,实现了从数据到结果的跨模型创新框架,将重建定位误差降低到传统方法的十分之一。同时也提示可以用人工智能来解决光学层析重建问题。”罗文健评论道。

然而,王坤强调,生物自发光断层扫描涉及肿瘤细胞的基因编辑和修改,因此只能用于动物,而不能用于人类。而他们开发的基于AI的光学三维重建方法得到推广,理论上可以用于光学分子图像的其他成像技术,如受激荧光成像、近红外成像等。因此,该方法本身具有良好的临床转化和应用能力。

数据收集和分析面临挑战。

机器学习的基础是数据,但是对于生物医学成像来说,构建大数据集是非常困难的。

“例如,在我们的研究中,构建了近8000个患有神经胶质瘤的小鼠模型来训练我们的机器学习模型。生物学家需要花费很长的时间和巨大的人力财力来一个一个地原位建立胶质瘤的小鼠模型,这是非常不现实的。”王坤说。

“我们建立的模拟数据达到了非常高的准确率,很好的模拟了真实的肿瘤动物。”王坤说,他们使用生物学家构建的真实神经胶质瘤小鼠来验证经过训练的人工智能模型是否准确可靠。最终结果显示,新的人工智能方法对胶质瘤的三维定位误差小于80微米,而传统方法的定位误差大于350微米。

然而,在实际的临床应用中,数据的收集和分析并不容易。罗表示,机器学习,尤其是深度学习,最重要的是数据,包括数据的质量和数量。目前,在医学影像领域,虽然

集到大量的数据比较容易,但是这些数据被标记后才能用于建模,受个体差异影响很大。由于不同医生的诊断结果不同,数据的质量会受到影响,用它训练出的网络就会存在问题。

同时,罗建文表示,在诊断、治疗、预后等一系列环节中,对于一些疾病的定性描述,不同的医生也存在很大的自由度,很难统一说法;不同品牌甚至同一品牌但不同型号的医疗设备采集到的图像,也存在较大差异。这些不统一的数据,都会影响深度学习的分析结果。

“还有一个重要的因素就是模型的因果性和可解释性。”罗建文强调,“医学与人的生命息息相关,所以做任何一件事都要有理有据,都要有因果推论的关系。但是,做机器学习模型时,很容易陷入直接对相关性进行建模的陷阱。相关性建模涉及的两个因素未必有直接的因果关系。得出的模型,如何解释其结果的意义,是一个很难处理的事情。”

临床任重道远

在罗建文看来,深度学习擅长处理的就是高维度、稀疏的信号,图像就是这些信号中一种有代表性的形式,因此,AI在医学影像处理上的应用必然是一个热点方向。

“医学影像处理的典型问题包括影像分类、目标检测、图像分割和影像检索等,都能对应到日常临床应用里的一些痛点或比较浪费人力的问题。”罗建文建议,影像医师应该投入到AI技术的学习和应用中,AI技术也许很快就能协助影像医生完成一部分工作,也有潜力使现有的工作得到提升。

不过,上海中医药大学附属曙光医院放射科主任詹松华站在医生的角度表示,AI在发现病变方面肯定大有作为,但是代替医生来处理,很难。“发现病变特点,然后区别正常和异常,到底是炎症还是肿瘤,最终还是由医生来做诊断。”

詹松华认为,AI用于生物医学影像的方向是对的,但是目前需要更多的科研投入,需要将医师和工程师很好地整合起来,AI人士需要倾听临床的声音,了解医生的切实需求。另外,AI解决假阴性率是关键,要提高AI机器判断的确定性,从而为医生省时节力。

  免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!

 
分享:
最新文章