点击左上角“思影科技”四个字,你会得到一个神秘的高手,法号“思影”,每天翻阅,你会练成脑影像数据处理的绝世神功。
真香警告:本文需要反复阅读理解并背诵全文。
几乎所有的脑影像统计分析都涉及一般线性模型(general linear model,GLM),包括任务态的一阶分析和几乎所有的基于体素或者基于表面的组水平统计。因此,掌握GLM模型在脑影像统计分析中至关重要(鲁迅先生说的)。本文将深入浅出讲解GLM在磁共振影像统计中的应用,适合磁共振影像研究的初学者入门及从业者温故。(觉得有用给个打call,老铁双击666)
一、广义线性模型与一般线性模型(前言)
在文章开始前,先说一说题外话,纠正一个常见的翻译错误(translation mistake)。在脑影像研究中,经常有人把GLM(generallineal model)翻译成广义线性模型模型,其实比较确切的说法应该是一般线性模型,而真正的广义线性模型的英文原文应该为generalized linear models(GLM)。我们先来看看这两者的定义:
广义线性模型(generalizedlinear models,GLM)是对普通线性回归的一种灵活的推广,它允许有误差分布模型且非正态分布的响应变量。广义线性模型通过允许线性模型通过连接函数(link function)与响应变量的相关以及允许每个测量的方差的大小作为其预测值的函数来推广线性回归。
公式为:
(纯手工制作,浓浓工匠情)
其中E(y)为y的期望值,Xβ是由未知待估计参数β与已知变量X构成的线性估计式,g则为链接函数。
也就是说,广义线性模型由两个部分构成:1、线性模型;2、连接函数(可以非线性)。其中的连接函数取决于Y的分布。
而一般线性模型(general linear model,GLM)的公式为:
(小学生都能看得懂)
其中Y是一个包含因变量的矩阵。X是一个包含独立自变量的设计矩阵。B是一个包含多个估计参数的矩阵。U 是一个包含误差和剩余项的矩阵。
眼尖的同学可能已经发现了,一般线性模型只包含广义线性模型的线性部分。当Y服从正态分布时,广义线性模型中的连接函数便为一个恒等式,也就是g(E(y))=y,此时广义线性模型就成了一个一般线性模型。也就是说,一般线性模型是一种特殊的广义线性模型模型,是广义线性模型的子集。而在脑影像研究中,我们只用到了广义线性模型的这种特殊形式,也就是一般线性模型(general linearmodel,GLM)。
从前文的公式中,我们可以发现,一般线性模型,就是将因变量Y分解为多个回归因子x与其在模型中的比重参数β的乘积的连加形式,并通过广义最小二乘法等算法将误差项ε降到最低的方式来拟合的模型。在fMRI研究中,此处的回归因子可以是一阶分析时任务态的源信号矩阵(onset与HRF的卷积)、逐时间点的头动参数;也可以是组水平统计(二阶分析)时的分组设计以及组水平的协变量如年龄/性别/病程/教育年限等。
二、从决定系数到显著性检验
上文说到的一般线性模型也可以用下式来表示
(中学生才能看懂)
皮完这一下,现在言归正传,现在假设我们有一组x,y。如表1所示
x
|
y
|
1
|
0.5
|
1
|
1.5
|
1.5
|
1
|
1.5
|
2
|
2
|
1.5
|
2
|
2.5
|
2.5
|
2
|
2.5
|
3
|
表1
现在我们在matlab里用plot函数用散点图的形式把它画出来。
然后我们再用polyfit函数(最小二乘法)求出线性回归的截距和斜率,which is 0和1。也就是说最拟合这组数据的直线是y=x。我们再用一个plot函数画到图1得到如下图2
图2
此时我们要引入一个方差的概念。方差用来度量随机变量和其数学期望(即均值)之间的偏离程度。它可以用来衡量数据的离散程度(这可以理解为数据的未知程度),也就是变异来源。
手绘,建议收藏
高中生都看不懂了
眼尖的同学可能要提出疑问了(独秀同学,你坐下),这里的决定系数为什么要在R上加一个平方呢?没错,此处的决定系数在数值上等于皮尔逊积差相关系数r的平方。
那么我们平时计算的相关是否显著的问题,是如何得到解答的呢?
众所周知,方差比值的分布服从F分布。因此,我们可以对回归引起的变异量与残差的比值进行F检验,即检验因回归减少的变异是否显著大于残差,便可得出相关的显著性水平。如下式:
字丑情真(不要在意那些细节)
至此,我们已经充分掌握了使用glm来计算模型的斜率和截距,并通过glm模型来计算相关系数和决定系数,以及最后对相关性进行显著性检验。至此,我们对glm的原理有了初步的认识。至于如何运用glm进行t检验和方差分析,以及设计矩阵和对比矩阵的设置和运用,请期待GLM下篇,或者参加思影科技的课程(点击获取,开始奇妙旅程):
第六届磁共振弥散张量成像数据处理班(一旦拥有别无所求,马上开车,速度上车)
第十三届功能磁共振数据处理基础班(从零都有,你值得拥有)
第二届脑功能磁共振提高班暨任务态fMRI专题班(task又火了起来)
第七届磁共振脑网络数据处理班(来了?老弟,来进阶)
第三届磁共振ASL(动脉自旋标记)数据处理班(精英序列)
第五届磁共振脑影像结构班 (皮层厚度,独步江湖)
第二届脑影像机器学习班(好high哦,感觉人生已经到达了高潮)
第一届脑电数据处理入门班 (给你点点点的快乐)
第十届脑电数据处理基础班(一起来优雅的改代码)
第十一届脑电数据处理基础班 (优雅改代码+1)
第四届脑电信号数据处理提高班(会改代码再来)
第一届眼动数据处理班(一眼情深似海)
少年,要和我们一起完成一番伟业吗?内含我本人联系方式,这么隐私的事情,一般人我不告诉他:
思影数据处理业务一:功能磁共振(fMRI)数据处理
思影数据处理业务二:结构磁共振成像(sMRI)
思影数据处理业务三:ASL数据处理