欢迎关注我们的微信公众号“思影科技”,不定期推送科研文章解读,回复原文获取原文下载连接。
当我们招完被试(求爷爷拜奶奶,四处张贴小广告),收完数据(每天晚上拖着疲倦的身体扫被试到凌晨),做完预处理,统计(一次次的报错,一次次的求大神帮忙),过五关斩六将,认为自己马上将要发SCI,走上人生巅峰的时候,不好意思,你还需要面对最残酷无情的对手:多重比较校正,比如FDR校正。当我们按下SPM中FDR按钮后,玻璃脑中空白一片,然后你的心哇凉哇凉的:What the !!!!!,又没通过校正!白跑了这么久的数据,浪费了实验室这么多电,老板会不会打我?
(玻璃脑表示,你随意算,有激活区算你赢!)
那什么是多重比较,什么是FDR校正呢?多重比较是统计学中的术语。当我们进行多次统计检验后,假阳性的次数就会增多,所以要对假阳性进行校正。
(网上实在找不到,就只有拍照了,像素渣不要紧,但我对你们的心是真的啊)
先解释一些概念:以任务态数据为例,先看一个体素。那么原假设(H0):该体素没有激活。从原假设基础上进行统计推断,得到P=0.02 < 0.05。所以我们拒绝原假设,然后推断出该体素激活。请注意:我们推断的这个结果有可能是错的,也就是说有可能错误地拒绝了原假设。这种犯错误的概率称之为假阳性率。这个例子里面假阳性率=2%,也就是说该体素激活的这种推断有2%的概率是错的(已经很不错了,有没有?走上人生巅峰了,有没有?差不多就行了,要啥自行车)。好!我们一般显著性水平设置为P=0.05。那么在1000次假设检验中,假阳性的结果就有1000*0.05=50次。我们希望的是假阳性是越少越好,所以要对假阳性进行校正。这个过程就称之为多重比较校正。
那什么是FDR校正呢?
先解释三个指标: Vaa,Via, Da=Vaa+Via。这个三个指标表示的是在V(比如这里V指体素个数)次测试中,它们各自出现了多少次。Vaa表示该体素本来就应该激活(Truly active),我们进行统计推断发现它确实激活了(Declared active)(确实是激活,真的不是脉动,也不是红牛啊)。Via表示该体素本来不应该激活(Truly inactive),我们进行统计推断发现它居然激活了(Declared
active)(这不应该啊,这不科学啊,幻觉!这一定是幻觉)。Da表示我们发现的激活的体素的个数。从上面可以看出,Vaa是我们想要的结果,而Via不是我们想要的结果(这里Via就是假阳性次数),因此我们要控制Via出现的次数。FDR公式如下:
或者,我们可以用中文表达该公式:
(为什么是岳不群,而不是东方不败加日月神教=武林至尊,一统江湖?东方姐姐在此表示不服)
FDR校正的是在检测出的激活的体素中(Da),伪激活(假阳性)的体素的个数(Via)。这里要注意和FWE校正的区别。FWE校正的是在所有被检测的体素中,假阳性体素的个数。
看了上面,是不是很难懂?当然了,如果你是他你就会懂了。他专门负责让人看不懂。
(鄙人表示,你不懂我)
最后举个例子:假设大脑总共有50000个体素(V=50000),通过假设检验发现有20000个体素的P<0.05,也就是说Da=20000。FDR和FWE的校正水平都设为0.05。那么FDR说的是在20000个激活的体素中,假阳性的体素不超过20000*0.05=1000个。FWE说的是在总共50000个体素中(包括检测到的激活的体素和不激活的体素),假阳性的体素不超过50000*0.05=2500个。FWE比FDR严格(好气哦,FEW什么的最讨厌了啦,法海你不懂爱!),是因为FWE控制的是全脑中假阳性次数,FDR控制的是我们发现的激活(Declared active)的体素中假阳性次数。
说了这么多,是不是感觉很晕,感觉智商不够用,感觉不会再爱了,这个时候你就会用非常期待,渴求的眼神对我说,大神,救救我们这些小白吧,我走上人生巅峰,迎娶白富美,怒嫁高帅富的机会就只有你能给我了,而此时我作为一名广告从业者,不好意思应该是培训从业者,礼貌而又恰到好处的给你推荐了思影科技第四届功能磁共振数据处理基础班
,(此处有广告,请谨慎点击)你是不是在黑暗中找到了希望,找到了那束光?然后对我敬仰之情,如滔滔江水连绵不绝。而此时的我总是事了拂衣去,深埋功与名。