为什么统计推断中默认使用参数估计?

Tips:点击图片进入下一页



统计推断做的是这样的一件事情:在确保样本具有代表性的前提下,将不同样本(或是样本与参照数据)进行比较,得出关于总体的结论。

既然统计推断做的是这样一件事,自然会想到这样来做统计推断:
基于数据估计出概率密度函数(对应“由样本推广到总体”的过程),再将它们进行比较,自然就是关于总体的结论。

但是,统计推断中最常用的方法却都依赖于参数估计。做参数估计时,先是要选定一个概率分布,然后再对这个分布的参数进行估计。
问题来了:我们可以得到数据,既然有数据,如果我们就可以由数据估计出概率的(密度)分布,为什么还要先选定一个概率分布呢?

简单说来,我觉得,非参数估计中基于密度估计的模型比参数模型在理论上更令人信服。

对非参数估计常见的批评是“会丢失信息”、“统计效力低”,这两个批评很相似,却不一样。
利用对数据排序后所得的次序或者是四分位数进行推断的非参数估计方法的确是会丢失信息,但是也还有基于密度估计的非参数方法。
而非参数估计的“统计效力低”是真的。但是,如果为了增高统计效力,加入一些无根无据的假设,这样得出的结果反而会远离真实,不是本末倒置吗?

可能有人会说,学界已经有大量研究讨论如何选定这些概率分布、这样得出的结论是否有效,等等。若是如此,为什么不将这种工作整合到密度估计的方法中呢?这样不是更合逻辑吗?

想不明白。再想就想到不好的地方去了


网友评论:

这是设定

——— 来自Stage1st Reader For iOS

bayes和传统统计的区别吧。

bayes和传统统计的区别吧。

非参数核密度估计的核函数选择实践中是个问题吧?
还有不是说存在“维度的诅咒么”
而且非参数估计应该不仅仅是核密度估计,急得也有k近邻回归之类的东西
要说不同理论肯定的具体问题具体讨论吧

而且统计分析实践中,统计参数进行比较简单直观,非参数估计大多很难讨论和解释

不过要这么说起来
半参数估计其实按说应该是比较折衷的理想选择吧?

非参的确正确率高,但是问题是并不实用,适用范围比较小,尤其在假设检验上。
举个可能不是特别恰当的例子,但是能大概说明非参的问题。
参数统计能告诉你某个妹子的三围喜好社交圈,但是有一定误差,可能不准。
非参统计告诉你妹子是活的。有可能在50岁以下。

你看,非参的确更加“正确”,但是并不实用。




问题来了:我们可以得到数据,既然有数据,如果我们就可以由数据估计出概率的(密度)分布,为什么还要先选定一个概率分布呢?

参数统计其实就是说你可以建立一个很explicit的model去fit your data,然后这个model有很好的theoretical foundation可以让你得到很多东西。非参相对来说少很多。
另外很多时候因为你的数据有大样本性质,可以看做近似正态,这是使用参数检验的一个极其强大的理由。比如说广义线性模型的Wald test和Score test。就算你使用likelihood ratio test都要用到chi-square



假设检验其实是可以用非参做的,比如permutation test

谢谢各位

看到了很多新东西,查了一下资料还是没明白,看来是暂时回复不了……



lz你的意思是说:我有了“足够”的数据就自然得到了这个系统的数据分布?对么?
我个人的感觉是,一个系统的数据分布其实是一个面,就像正态分布它的数据分布在钟形的面积里一样,这个面的每个点都是一个数据点,而一个面是可以包含无数个点的,所以理论上,一个系统的数据分布是由无数个数据来形成的,我们需要无数个数据来描述这个系统,这显然是不可能的,所以我们需要参数统计的模型来模拟,看这个系统在多少的误差允许下是符合哪种模型的。
这是我个人的见解