【科技】PNAS:假阳性率高达70%,大约4万篇使用fMRI的论文不可信?

Tips:点击图片进入下一页

来源:生物谷 2016-07-11 22:30





2016年7月11日/生物谷BIOON/--在25年前,功能性磁共振成像(functional magnetic resonance imaging, fMRI)就出现了。它是一种新兴的神经影像学方式,其原理是利用磁振造影来测量神经元活动所引发之血液动力学的改变。

这种成像方法将大脑分割成被称作体素(voxel)的小单元,然后测量每个体素的脑活性。接着,用于fMRI分析的软件包对这些体素进行分类整理,寻找具有类似活性的体素簇(cluster)。 迄今为止,由于fMRI的非侵入性、没有辐射暴露问题与其较为广泛的应用,从1990年代开始就在脑部功能定位领域占有一席之地。目前,fMRI已被广泛地用于神经科学,主要是用于研究人及动物的脑或脊髓。但是令人吃惊的是,它的最为常见的统计学方法从没有利用真实的数据加以验证。

为了解决这个问题,在一项新的研究中,来自美国麻省总医院的研究人员使用499名健康人的静息态fMRI数据来开展3百万次任务组分析。在不同的实验设计中使用这些数据,他们估计了显著性结果的发生率。在理论上,研究人员应当发现5%的假阳性率(显著性阈值为5%),但是实际上,他们发现用于fMRI分析的最为常见的软件包(SPM、FSL和AFNI)能够产生的假阳性率高达70%。这一发现对大约4万篇使用fMRI的研究论文的可信性提出质疑,而且可能对理解神经成像结果产生重大的影响。 相关研究结果于2016年6月27日在线发表在PNAS期刊上,论文标题为“Cluster failure: Why fMRI inferences for spatial extent have inflated false-positive rates”。论文通信作者为瑞典林雪平大学科学家Anders Eklund。

除了发现令人吃惊的高假阳性率之外,研究人员发现AFNI软件包存在一个漏洞。当使用这种软件的漏洞排除版本时,它能够将假阳性率降低10%以上。

最后,研究人员提到,在之前的研究中,利用这种存在功能缺陷的软件包AFNI进行分析时产生的大多数数据是不能够获得的,因此不能够轻松地再次分析这些数据。(生物谷 Bioon.com)





Cluster failure: Why fMRI inferences for spatial extent have inflated false-positive rates

Anders Eklund, Thomas E. Nichols, and Hans Knutsson

doi:10.1073/pnas.1602413113
PMC:
PMID:

The most widely used task functional magnetic resonance imaging (fMRI) analyses use parametric statistical methods that depend on a variety of assumptions. In this work, we use real resting-state data and a total of 3 million random task group analyses to compute empirical familywise error rates for the fMRI software packages SPM, FSL, and AFNI, as well as a nonparametric permutation method. For a nominal familywise error rate of 5%, the parametric statistical methods are shown to be conservative for voxelwise inference and invalid for clusterwise inference. Our results suggest that the principal cause of the invalid cluster inferences is spatial autocorrelation functions that do not follow the assumed Gaussian shape. By comparison, the nonparametric permutation test is found to produce nominal results for voxelwise as well as clusterwise inference. These findings speak to the need of validating the statistical methods being used in the field of neuroimaging.