为更好地帮助到想要利用神经影像做科研的客户们,拓展思影科技的业务范围,思影科技推出脑影像机器学习数据处理业务。如感兴趣请联系杨晓飞siyingyxf或18983979082(微信号)进行咨询,电话:18580429226
一、数据质量检查
数据质量检查包括:
(1)对于原始数据,检查图像是否具有明显的形变、缺损、伪影等;
(2)检查图像参数是否合适,如图像维度、体素大小等;
(3)对于预处理后的数据,检查所有被试的图像参数是否一致。
二、特征构建
本部分描述可用于后续分类/预测的影像指标及其筛选方式。
2.1特征构建
1.fMRI指标。fMRI(功能磁共振)数据经过时间层校正、头动校正、空间标准化、降噪等预处理步骤后,可计算ALFF(低频振幅)、ReHo(局部一致性)、FC(功能连接)、VMHC(镜像同伦功能连接)等指标。以上指标可以在体素水平计算。
图示.fMRI指标:ReHo(左)与ALFF(右)
2.sMRI指标。sMRI(结构磁共振)数据经分割后,可计算灰质体积/密度、白质体积/密度等指标;也可计算皮层厚度、皮层局部回指数等指标。以上指标可以在体素/顶点水平计算。
3.dMRI指标。dMRI(弥散磁共振)数据经头动涡流校正、张量拟合等预处理步骤后,可得到FA、MD、AD、RD等指标。以上指标可以在体素水平计算。
图示.弥散影像指标。
4.灌注成像指标。基于灌注成像数据(如ASL,即动脉自旋标记数据),可以计算脑血流(CBF)等指标。以上指标可以在体素水平计算。
5.脑网络。利用特定的脑图谱(如AAL Atlas),基于fMRI数据,可以构建全脑功能脑网络;基于dMRI数据,可以构建全脑结构脑网络(FA、FN加权)。以上指标非体素水平指标。
图示.功能脑网络示例
6.特征尺度可改变。上述fMRI、sMRI、dMRI、灌注指标,皆可提取特定脑区的数值作为特征。利用特定的脑图谱,可提取每个单独脑区的平均指标值。
图示.提取每个单独脑区的指标作为特征。
7.行为量表。您自行收集的行为量表得分,也可作为特征纳入后续分析。
8.PET。PET(正电子发射断层显像)数据经过头动校正、空间标准化、平滑等预处理步骤后,可计算SUV(标准摄取值)等指标。以上指标可以在体素水平计算。
图示.PET指标SUV
注:上述内容包含了常见的脑影像指标,理论上几乎所有影像指标都可以作为特征来使用,如果您有合适的想法,可以联系我们进行协商。上述指标的具体计算,可以参考我们的其他数据处理业务。
2.2 特征筛选
1.相关法。计算每个特征与量表的相关性(如皮尔逊相关),保留相关值高的特征。
2.参数检验法。对不同组别人群的特征做假设检验(比如对两组人群的特征做双样本T检验),保留通过假设检验的特征。
3.主成分分析(PCA)法。将所有特征分解成一系列主成分,保留排名靠前的主成分作为特征。
4.递归特征消除法。循序渐进地删除影响最小的特征,直至保留特定数目的最重要的特征为止。
5. 稀疏特征表示。可以选择使用LASSO回归(及其变种)、低秩(Low-Rank)等特征选择/表示方法。
三、机器学习方法
机器学习模型是实现分类/预测的核心所在,我们可以提供神经影像领域最为热门的模型,方便大家选择。这些模型可用来实现MVPA分析,寻找合适的影像生物标记。
3.1可用模型
1.支持向量机(SVM)。在许多情况下,支持向量机都是二分类模型的首选。通过使用核函数,即使基于线性不可分的数据,也可获得较好的分类精度。引入投票机制后,亦可将该模型应用于多分类场景。
图示.支持向量机(SVM)。
2.回归模型。回归模型主要用于预测连续变量(如量表得分)。可选的回归模型有线性回归(GLM)、多项式回归等,也包含其变种,如LASSO回归、岭回归、Elastic Net等。其他可选回归模型有:支持向量回归(SVR)、关联向量回归(RVR)等。
图示.各种回归模型。
3.集成学习。当单一的分类器性能不良时,可以考虑集成多个弱分类器,形成一个强分类器。可选的集成学习模型有随机森林等。
4.神经网络。当没有良好的手工选择的特征时,可以考虑选用深度神经网络(主要基于CNN来实现)模型。该模型可以自动从原始数据中提取特征,用于后续的预测任务。
5.聚类。当数据没有标签时,可以选择无监督学习算法,如K-means聚类。
6.上述模型的变种。如基于脑连接组的预测模型(CPM),是一种利用脑网络特征和线性/多项式模型进行预测的方法。
图示.基于脑连接组的预测模型(CPM)。
7.多模态融合学习。可以对多种模态的特征kernel进行融合,实现多核SVM学习;也可以使用卷积神经网络融合多模态数据,充分利用各种模态的特征。
图示.基于多模态特征的SVM分类
图示.使用卷积神经网络进行多模态融合
3.2参数优化&精度评估
如果选择的模型具有超参数,则可以选择进行超参数优化(即“调参”)。为了量化模型的预测效果,需要进行精度评估。参数优化与精度评估皆可通过交叉验证的方式进行。可选的交叉验证方式:S折交叉验证、留一交叉验证、嵌套交叉验证等。
图示.交叉验证过程
为了验证精度指标是否显著有效(区别于随机猜测),可以打乱数据的标签,重新训练并预测。上述置换检验的过程,可以计算用来验证精度指标结果是否可靠的p值。
注:我们可以提供的机器学习模型包括但不限于以上内容。其他模型如K近邻、朴素贝叶斯(Naive Bayes)、线性判别分析(LDA)、主成分分析(PCA)、决策树或上述模型的变种,亦可根据需求实现。您可以选择其中的一种或多种进行尝试。
四、结果汇报&可视化
结果汇报内容包括:
(1)对于分类模型,可汇报敏感性(Sensitivity)、特异性(Specificity)、总精度、ROC曲线下面积(AUC)等精度指标;
(2)对于回归模型,可以汇报相关值、MSE、MAE等精度指标;
(3)置换检验的结果,如p值。
图示.ROC曲线可视化
结果可视化内容包括:
(1)对于分类模型,可绘制ROC曲线图;
(2)对于回归模型,可绘制相关图;
(3)对于模型训练过程中发现的贡献较大的特征,可绘制点线图、矩阵图、圈状图等等。
图示.体素特征权重可视化
图示. 脑网络特征的点线图、矩阵图、圈状图可视化
五、基于最新的机器学习(如深度神经网络)模型,我们还可以对脑肿瘤影像进行影像组学分析。
六、定制化服务
图示.工程师在讨论
1.分析方法可定制。思影科技可根据您提供的模板文献,基于您的实验数据,实现文献中使用的数据分析方法。此外,未列出的分析方法,只要在思影科技的能力范围内,尽力实现您的想法。
2.分析代码可定制。您可以选择不同的平台/软件来实现想法。在没有现有的软件适用于您的数据分析需求时,思影科技会与您协商,通过编写代码实现您的想法,并提供代码的完整实现。
3.可视化方案可定制。如果您有特殊的可视化方案要求,也可与我们协商实现。
微信扫码或者长按选择识别关注思影
如对思影课程感兴趣也可微信号siyingyxf或18983979082咨询。觉得有帮助,给个转发,或许身边的朋友正需要。请直接点击下文文字即可浏览思影科技其他课程及数据处理服务,欢迎报名与咨询,目前全部课程均开放报名,报名后我们会第一时间联系,并保留名额。
|