将近一年前学的概率论,都差不多还给老师了。 在看BatchNorm推导时,看到方差S^2为什么对应的是1/(n+1)。
那么为什么最后推导出来的公式是1/n-1而不是1/n呢?仔细观察上面的推导过程就可以发现,如果想要最后结果是1/n那么需要在这里插入图片描述,可是它虽然将方差缩小了n倍,可他依然是存在的,除非总体标准差等于0,那这样又意味着每个样本的个体处处等于期望值。 如果你已知这个样本的期望值u,那么在这里插入图片描述 就是总体样本方差的无偏估计,推导公式如下: 从这两个推导公式来看,差别就在于E((—/X)^2)和E(X^2)不一样,对于统计量样本的准确样本均值u,其方差为0,而已知部分样本的均值,其方差不为0.
总结一下:如果你可以得到这个统计量样本的准确样本均值u,那么上述的第二个公式可以直接求出该样本方差;但如果不知均值,而是通过抽样法得到部分均值,然后利用第一个公式求样本方差。
先说一下什么是自由度。 自由度定义: 统计学上,自由度是指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的数据的个数,称为该统计量的自由度。一般来说,自由度等于独立变量减掉其衍生量数。举例来说,变异数的定义是样本减平均值(一个由样本决定的衍生量),因此对N个随机样本而言,其自由度为N-1。
数学上,自由度是一个随机向量的维度数,也就是一个向量能被完整描述所需的最少单位向量数。
举个简单的例子,对于式子x+y=7,它的自由度为1,因为当x随意取值时,为了保证最后和为7,y其实是不自由的。 那么这个时候反过来看我们的样本方差:在这里插入图片描述 对于这个公式中部分样本均值是已知的X,那么n个数据自由度即为n-1,这又从另一个角度说明了为什么是1/n-1而不是1/n。