影像组学简述

影像组学简述

影像组学的工作流程

一、 图像采集
多模态的数据采集方法,使用各种成像方法的都有,不局限。

二、图像分割
滑降区域生长法、图割法、半自动分割算法、基于容量CT的分割法,目前并无可用的通用的方法,自己的数据集有自己的方法。

三、图像特征提取与量化(这是我们在特征提取时可采用的方法)
影像组学特征可以分为:形状特征,一阶直方图特征,二阶直方图或纹理特征。还有一些获取于特定图像的影像组学特征(如PET中的SUV度量),以及仅适用于多模式数据集的分形和融合特征。
1、形态特征:包括描述ROI大小的特征,例如体积、表面积、二维和三维的最大直径以及有效直径(与ROI具有相同体积的球体直径),以及描述ROI与球体的相似程度的特征,如表面体积比、致密度、偏心度、球形度等。(简单来讲,就是几何形态上的特征,就和我们计算的体积具有相同意义的特征)
2、一阶直方图特征(统计学特征):描述与ROI内的体素强度分布有关的特征,不包含它们之间相互的空间作用,可通过直方图分析计算得到,包括均数、中位数、最小值、最大值、标准差、偏度和峰度。这些特征可反应所测体素的对称性、均匀性以及局部强度分布变化。(简单来讲就是统计上可以计算出的图像灰度值存在的特征)
3、二阶直方图特征或纹理特征(统计学特征):是描述体素空间分布强度等级的特征。图像纹理是指在强度水平可感知或可测量的空间变化,它被视为一个灰度级,是一种视觉感知的图像局部特征的综合。二阶特征包括:灰度共生矩阵(gray level co-occurrence matrix,GLCM)、灰度级长矩阵(gray level run-length matrix,GLRLM)、灰度级带矩阵(gray level size zone matrix,GLSZM)和邻域灰度差分矩阵(neighborhood gray-tone differencematrix,NGTDM)。(简单来讲,就是图像灰度值之间存在的相互关系)
1)灰度共生矩阵:是一个其行列数表示灰度值、单元格包含灰度值处于一定关系(角度、距离)次数的矩阵,也称为二阶直方图。在灰度共生矩阵上计算的特征包括熵(二阶熵,与异质性有关)、能量(也被定义为角二次矩,再次描述图像的均匀性)、对比度(其测量局部变化)、同质性(图像局部灰度均衡性的度量)、不相似性和相关性。灰度共生矩阵的基本原理是影像上一定距离的两个像素的灰度值之间存在着一定的空间相关关系,对这个空间相关关系进行统计分析,利用各种纹理描述,改写相关像素的灰度值,使其纹理特征能够清晰显示。
2)灰度级长矩阵:其中每个元素(i,j)描述了灰度级在指定的方向上连续出现的次数。
3)灰度级带矩阵:是在行和列处的元素存储具有灰度级和大小的区域(具有相同灰度级的连接体素)数量的矩阵。灰度级带矩阵包括描述小/大区和低/高灰度区分布的特征。
4)邻域灰度差分矩阵:是在行和列处的元素存储具有灰度级和大小的区域(具有相同灰度级的连接体素)数量的矩阵。GLSZM包括描述小/大区和低/高灰度区分布的特征。
4、融合与分形特征:融合特征与多模态图像数据集相关,其可通过配准技术与几何图像对齐。分形特征是分析评估不同层面表面的自相似性和粗糙度,这些区域的复杂性由Hausdorff的分形维(fractal dimension, FD)量化呈现,该分形维是一个模式的自我重复纹理,并具有放大特征。(之前没有接触过)
(田捷老师的一张图,可以提取的特征非常多)
注:
①pyradiomics是一个开源的python包,用于医学图像的影像组学特征提取。

四、特征选择(也就是特征降维,筛选出有效特征,这是核心)
最简单的特征选择方法是根据变量的稳定程度或相关性制定一个评分标准,以此标准对变量进行筛选。另外,在消除相关特征时,使用相关矩阵消除高度相关的特征,通过消除那些高度相关的特性,剩下“非冗余”的特征集,其中常用的方法有LASSO(least absolute shrinkage and selection operator)Cox回归模型、最大相关最小冗余(maximum relevance and minimum redundancy,mRMR)、RELIEF (RELevance In EstimatingFeatures)、主成分分析法(principal component analysis,PCA)等(之前用过PLS相关与回归分析,仍然可以用于我们的超声实验,PLS相关是集合主成分分析和典型相关分析的一种分析方法,其他的方法我觉得都不如PLS方法好,因为PLS既能解决y多x少的情况,也能解决x之间相关性比较强的情况)。

五、建立模型(预测与分类模型,与上述的特征选择可以一起做)
在影像组学建模中,logistic回归模型因其简单易行,成为最受欢迎且常用的监督分类器;另外,常用的机器学习模型还有随机森林(random forest)、支持向量机(SVM)、人工神经网络(Artificial neural networks,ANNs)、聚类分析(clustering analysis)、“leave-one out”交叉验证(LOOCV)、自举法(bootstrapping)。
1、随机森林:是基于机器学习中一个较普遍的决策树概念,将假设表示为连续的“如果-然后”,这一点很类似于人类推理。在该方法中,训练一组决策树,并且该算法引入两个级别的随机化。所有的决策树被训练后,对所有单株树进行预测,并将选出最高频的一类作为最终结果。
2、支持向量机:是一种先前用于CAD的有辨识监督机器学习的技术,它利用边界将数据点分为两类(如反应者或无反应者),该方法在CAD微钙化检测中有较高的判别力,并经常用于影像组学。
3、人工神经网络:是经典的机器学习方法之一,也被用于基于超分类的基因组学研究。卷积神经网络(Convolutional Neural Network,CNN)是一种特殊的前馈神经网络,用于学习直接对原始图像进行操作的图像数据的分层表现,通过尝试自动提取高度表现的成像特征,CNN消除了对图像预处理和特征选择的依赖性。该方法在MRI对三阴乳腺癌的判别中要优于其他预测模型。
4、聚类分析:属于无监督分类(unsupervised classifiers),其可将抽象对象集合分组,在分组的过程中对类似的对象组成的多个类进行分析,目标是在相似的基础上收集数据来进行分类。共识聚类(consensusclusterin)是常用于降维的聚类分析。有报道称共识聚类可以在440个特征的集合空间中识别出13个非冗余特征聚类。
5、交叉验证:该算法除了一个数据点被用于测试外其余所有数据均用于训练或拟合,这个过程在每次LOOCV迭代中重复,使得每个数据点只剩下一次。
6、自举法:由原始数据生成大量自举样本,引导数据集是一系列数据(特征,结果),每个数据来自患者队列中随机选择的患者,每个自举样本重复建模。该方法提供了模型参数和模型评估指数AUC或CI值的分布,从而可以评估特征的不确定性。
注:
①随机森林推荐使用R包:randomForestSRC

六、选择治疗方法

影像组学的应用
1、CT纹理在肺癌鉴别、治疗、生存期预测的应用;
2、采用深度学习(基于分割和分类的卷积神经网络CNNs)检测膝关节磁共振中软骨病变;
3、深度卷积神经网络(DCNN)在MR成像进行肝纤维化分期;
4、MR成像的放射组学分析鉴别良恶性乳腺病变;
5、利用影像组学分类心机梗塞;
6、CT图像纹理特征预测治疗的肝癌晚期

猜你喜欢

转载自blog.csdn.net/qq_41989587/article/details/83011123