面積や体重の推定時におけるバイアスを持った誤差

例えば正方形の面積を測りたいとして、その一辺を測定する。
真の一辺の長さをlとした時その観測値lobsを
lobs=l+ε
ε~N(0,σ^2)
だとする。
n回観測を行い、それぞれの観測データをlobs_iとした時に面積の推定値としてaverage(lobs_i^2)とすると、正のバイアスが生まれる

何故なら
lobs^2=(l+ε)^2=l^2+2εl+ε^2
average(2εl)=0だから
average(lobs^2)=l^2+average(ε^2)
となり、average(ε^2)は正の値だから。

正しくはaverage(lobs_i)^2として出さなければならない。

つまり、一辺を計ってそのたんびに面積を出して平均すると、真の値より過大推定する可能性があり、辺の長さの平均を出してから二乗するよりも精度が悪い可能性がある。
これは、割と直感的理解と相反する結果に思える。


もちろん、誤差をどのように与えるかによって結果は変わってくるが、体長データなんかは結構このような誤差が生まれていると考えられるので、例えばある年齢の体長データから体長-体重関係*1を使い平均体重を推定する際には、(一つの年齢内では同体長と仮定する限り)体長を平均させてから、体重を計算させないとバイアスのある推定誤差を生む可能性がある。

*1:W=aL^b等