3.3 均值与方差的点估计
在实际问题中,根据子样的数据,计算出的子样特征数与S2,通常用来作为相应总体特征数的估计量。对于服从正态分布的总体,均值为μ,方差为σ2(参见2.6节)。当子样是从一正态分布的总体中随机抽出的一部分时,可用子样平均值
去估计该总体的均值μ,而用子样方差S2去估计总体方差σ2,这在数理统计中称为点估计,即
![](https://epubservercos.yuewen.com/84A7D5/17180255205318806/epubprivate/OEBPS/Images/img00051008.jpg?sign=1739220725-beMkZMEx30l9bJFy7ZtGyDAEymbqYJH1-0-0bfe29509f34cffe34d30153d98573cd)
![](https://epubservercos.yuewen.com/84A7D5/17180255205318806/epubprivate/OEBPS/Images/img00051009.jpg?sign=1739220725-2Uyz19KbfsOEJfYE2L51Jhbq1gD8IqpA-0-0c5671faa48910e2086e3b3643dd8741)
其中,“^”为估计量的符号。用子样特征数去估计总体特征数,很重要的一点是前者为后者的无偏估计量。也就是说,当用 作为
或用S2作为
时,子样特征数应满足这样的要求,即它的数学期望(统计平均)应当等于它所估计的参数本身,即
![](https://epubservercos.yuewen.com/84A7D5/17180255205318806/epubprivate/OEBPS/Images/img00051013.jpg?sign=1739220725-5pqYjtlgafGh55idhn9Ny1bN3nk7ryhc-0-7cbd0ffe1d0b87b798061ceaa70a1ad8)
![](https://epubservercos.yuewen.com/84A7D5/17180255205318806/epubprivate/OEBPS/Images/img00051015.jpg?sign=1739220725-pMF8HkelPt3etSkOL4Qm18D1QWt8MdWc-0-347a1a8c213a9498623de2409d4161c7)
这个要求称为无偏性。
我们通常计算的算术平均值是满足这个要求的。根据概率论中数学期望的性质,有
![](https://epubservercos.yuewen.com/84A7D5/17180255205318806/epubprivate/OEBPS/Images/img00051014.jpg?sign=1739220725-i1J65iOkA6NwGdsKQDS3Iqwa3rymgvD3-0-6daf9ec6a508f841c0157268b322c941)
由于x1,x2,…,xn相互独立,都是随机变量x的估计值,因此,可把子样值xi看成是一随机变量,且与随机变量x有相同的理论分布和理论均值μ。于是,式(3-7)变为
![](https://epubservercos.yuewen.com/84A7D5/17180255205318806/epubprivate/OEBPS/Images/img00052001.jpg?sign=1739220725-AXuZL4XNrMVBApqbwee2WH2A9KovQiJ7-0-e85848508bf65663d09529fa04d09849)
至此,式(3-5)得证。该式表明,子样均值 是总体均值μ的一个无偏估计量。
所谓无偏估计,当然不是说用无偏估计量来估计不产生偏离,只是说由于子样数据算出的估计值离被估计值很近,由不同子样得到的估计值在被估计值附近波动,大量估计值的平均值能够消除估计值对被估计值的偏离。正是根据子样平均值是总体均值的无偏估计值这一观点,重复测定某一物理量,如测定值的分布服从正态分布,则算术平均值即为一组等精度测量中的最佳值或最可信赖值。换句话说,算术平均值很接近真值μ(总体均值)。可以证明,算术平均值与测定值偏差的平方和最小。
设有一不等于算术平均值的任一数A,则必有
![](https://epubservercos.yuewen.com/84A7D5/17180255205318806/epubprivate/OEBPS/Images/img00052002.jpg?sign=1739220725-brwqhi5DZh1rUs8Iix9H1OVtQGu2I9gp-0-48735c011375bbb532ed539330070a91)
对式(3-9)的证明如下:
由式(3-9)左边得
![](https://epubservercos.yuewen.com/84A7D5/17180255205318806/epubprivate/OEBPS/Images/img00052003.jpg?sign=1739220725-IWQk9TOPFTGZPsWlVBpnZG6lQXJqkC9Q-0-794c5120815ee88e684d4139c8818e60)
移项得
![](https://epubservercos.yuewen.com/84A7D5/17180255205318806/epubprivate/OEBPS/Images/img00052004.jpg?sign=1739220725-2J0htvnARqnP5qYB9DbpglC2ZS9F0Arp-0-fa79b7bc417acb5227b5cfc2aac5b8ed)
因A≠ ,又n是正整数,则必有
![](https://epubservercos.yuewen.com/84A7D5/17180255205318806/epubprivate/OEBPS/Images/img00052006.jpg?sign=1739220725-fvrUkj9Crw5XkaaDCqRwHMBhKHvYcGnd-0-7ca0a3d5b21fc5fc9a6b8eaa17dd8bb5)
即
![](https://epubservercos.yuewen.com/84A7D5/17180255205318806/epubprivate/OEBPS/Images/img00052007.jpg?sign=1739220725-51exEvdraCnsr6jwQxWbK0sU2Ys3LAnc-0-bcd8d43bebd1bc83212163a8bc7b0ae8)
所以
![](https://epubservercos.yuewen.com/84A7D5/17180255205318806/epubprivate/OEBPS/Images/img00052008.jpg?sign=1739220725-KJO8JNSI1bzcGjUJjol8m3gNirc8Te1R-0-3708c3360e35cb07b63153d9deb962ec)
于是,式(3-9)得证。
子样平均值可作为总体均值μ的最佳估计值,这只给出了问题的一个方面。一般来说,子样均值并不等于总体均值μ。换句话说,用
去估计μ是有误差的。人们往往对这一方面也是很关心的,所以有必要介绍以下平均值的标准差。
下面根据概率论中方差的性质来进行推导:
![](https://epubservercos.yuewen.com/84A7D5/17180255205318806/epubprivate/OEBPS/Images/img00052011.jpg?sign=1739220725-NiaOyefB0NtbTPzNw2y1ccSZc0Hv53pG-0-6eb468dcfafa784906773a66a2abb4b5)
由于x1,x2,…,xn相互独立,都是随机变量x的估计值,与随机变量x具有相同的分布和理论方差σ2。因此,式(3-11)变为
![](https://epubservercos.yuewen.com/84A7D5/17180255205318806/epubprivate/OEBPS/Images/img00053001.jpg?sign=1739220725-J8OctFxzdgQqnrv0hrhKxfXShQdXImng-0-d606eb2b37d832e461cba0ab48f273f8)
该式表明,算术平均值的方差是该总体方差σ2的1/n。由式(3-12),得
![](https://epubservercos.yuewen.com/84A7D5/17180255205318806/epubprivate/OEBPS/Images/img00053002.jpg?sign=1739220725-O8iTBQPjyijZd7ih6YaUe4SuO5Jzq2Te-0-6db90503566f9eb28d9c7792f374cd63)
即平均值的标准差 是平均值方差的开平方。通常,总体标准差σ是未知的,所以算术平均值的标准差常用下式表示,即
![](https://epubservercos.yuewen.com/84A7D5/17180255205318806/epubprivate/OEBPS/Images/img00053004.jpg?sign=1739220725-X7fdQwrOehg0gYDwmiLVi8SruGf1B4VT-0-0be8d9cffebfe7766af02a345a40f281)
这个公式表明了平均值的标准差
与子样标准差S的关系。当标准差S不变时,n增大,算术平均值的标准差减小,即用
作为
估计的精度高。这个结论给我们以启示,在分析测定时,测定次数(子样容量)n不能太小,否则算术平均值的误差将增大。但要注意,对于式(3-14),S不变时,n>5以后,子样均值的标准差随n的增大而减小得很慢。这就是说,单靠增加观测次数来提高实验的精密度是不够的。这就意味着,要把更多的精力用来改进测试技术,往往比重复老一套的测试精度不高的测量更有意义。因此,在实际测定某一量时,由于多方面条件的限制,重复测定的次数n很少超过50次,一般在4~20次左右。
下面来证明式(3-6),由式(3-2)
![](https://epubservercos.yuewen.com/84A7D5/17180255205318806/epubprivate/OEBPS/Images/img00053009.jpg?sign=1739220725-cauV0nyilGGKv9dgv9nc8NT504XFNEZu-0-5a277b650616997bd39073724518e166)
同式(3-10)的推导类似,有
![](https://epubservercos.yuewen.com/84A7D5/17180255205318806/epubprivate/OEBPS/Images/img00053010.jpg?sign=1739220725-tL2pjsgR5FCZUzMArmx33YoKddjR6478-0-47ff58e978cae7fce8550b0020a59fda)
根据概率论中数学期望的性质、方差的定义及式(3-12),有
![](https://epubservercos.yuewen.com/84A7D5/17180255205318806/epubprivate/OEBPS/Images/img00053011.jpg?sign=1739220725-OJ79HQFsppa3wXaQN54rbycM8HBgIa0F-0-9edde92d0bb5f61bbf7bccb70026b7d3)
由于σ2的估计量S2的数学期望,等于被估计参数σ2的本身,这就证明了S2是σ2的无偏估计量。