中国科学院生物与化学交叉研究中心

中文 | EN

中心概况

 
您的位置: 首页 > 科学研究 > 科研进展
科研进展

Analytical Chemistry |朱正江课题组发表适用于临床诊断的质谱图像化编码策略MetImage

发布时间:Apr 13, 2023

中国科学院上海有机化学研究所生物与化学交叉研究中心朱正江研究员团队在Analytical Chemistry杂志在线发表了题为“Encoding LC−MS-based Untargeted Metabolomics Data into Images toward AI-Based Clinical Diagnosis”的研究论文 (Analytical Chemistry, 2023, https://doi.org/10.1021/acs.analchem.2c05079)。该工作开发了一种将基于液相色谱−质谱联用技术(LC−MS)的非靶向代谢组学数据编码为多通道图像 (Multi-channel image)的方法,编码后的多通道图像可以输入到深度学习模型中进行疾病的精确诊断。朱正江课题组博士研究生王洪淼是论文的第一作者,中国科学院上海有机化学研究所生物与化学交叉研究中心为第一单位。


1.jpg


基于液相色谱−质谱联用技术的非靶向代谢组学方法为临床研究提供了对小分子代谢物的全面定量分析,在临床研究中具有重要作用。传统的临床代谢组学研究往往需要经历复杂且耗时的特征筛选,从而只有少数代谢物可以作为生物标志物进行临床诊断应用。基于全代谢组的疾病诊断研究是一个很有发展前景的策略,但是具有很大的技术挑战。 基于此,作者开发了一种将非靶向代谢组学数据转换为多通道数字图像的策略,名为MetImage,以实现基于全代谢组的临床疾病诊断。


MetImage的工作流程如图1所示。在获得基于LC−MS的非靶向代谢组学数据后,MetImage首先把质谱数据转换为与数字图像相似的格式,称为全代谢组图像;然后将全代谢组图像切分成更小的图块便于后续分析;除此之外,为了最大限度的保留图像中含有的信息,本文使用了基于图块池化信号强度和图像熵的策略进行图块筛选,筛选后的图块所堆叠而成的多通道图像可直接输入基于深度学习的人工智能(AI)模型中进行训练或后续的疾病诊断应用。通过这一方式生成的多通道图像保留了LC−MS数据的原始形态,因此可以将图像数据与其中的代谢物信息相关联。


2.jpg

1. MetImage的工作流程 (图片修改自Analytical Chemistry论文)


为了验证MetImage在临床诊断中的效果,本文在一个食管鳞状细胞癌(ESCC)筛选队列(n=1104)上训练了基于图卷积神经网络的食管癌AI筛查模型。在验证集上,食管癌AI筛查模型取得了优异的性能(2),模型的敏感性为85%,特异性为92%,受试者特征曲线下面积(AUC)为0.95。进一步的分析表明,该筛查模型对不同ESCC的进展阶段均展示出良好的判别性能。


此外,本文对该AI筛查模型的可解释性进行了研究。由于MetImage的编码策略保留了原始LC−MS数据的质谱特征,能够轻松对关键图像中的特征代谢物进行鉴定,进而能对模型的诊断原理进行阐明,证明了该AI模型并非“黑匣子”。这项研究为利用全代谢组信息进行AI辅助的临床应用提供了新的思路,并通过可解释性的深度学习模型提升了其在临床研究中的应用价值。


 

3.jpg

2. 基于AIESCC筛查模型在验证集下的判别性能(图片修改自Analytical Chemistry论文)


 目前,该工作所开发的图像编码方式MetImage已经申请了国家发明专利。相关技术和软件的商业用途需要联系朱正江研究员进行授权使用。该工作得到了国家自然科学基金委、科技部、上海市科委等基金项目的资助。


论文链接:https://pubs.acs.org/doi/10.1021/acs.analchem.2c05079



中国科学院生物与化学交叉研究中心 版权所有 电话:021-68582285/68582282
地址:上海市浦东张江高科技园区海科路100号 沪ICP备05005485号-3