Oinriktade och partiska uppskattare

Ett av målen med slutlig statistik är att uppskatta okända befolkningsparametrar. Denna uppskattning utförs genom att konstruera konfidensintervall från statistiska prover. En fråga blir: "Hur bra har vi en estimator?" Med andra ord: "Hur korrekt är vår statistiska process på lång sikt för att uppskatta vår populationsparameter. Ett sätt att bestämma värdet på en estimator är att överväga om den är opartisk. Denna analys kräver att vi hittar det förväntade värdet på vår statistik.

Parametrar och statistik

Vi börjar med att överväga parametrar och statistik. Vi tar hänsyn till slumpmässiga variabler från en känd typ av distribution, men med en okänd parameter i denna distribution. Denna parameter gjordes vara en del av en population, eller den kan vara en del av en sannolikhetsdensitetsfunktion. Vi har också en funktion av våra slumpmässiga variabler, och det kallas en statistik. Statistiken (X1, X2,..., Xn) uppskattar parametern T, och så kallar vi det en uppskattare av T.

Oinriktade och partiska uppskattare

Vi definierar nu opartiska och partiska estimatorer. Vi vill att vår estimator ska matcha vår parameter på lång sikt. På mer exakt språk vill vi att det förväntade värdet på vår statistik ska vara lika med parametern. Om detta är fallet, säger vi att vår statistik är en opartisk uppskattning av parametern.

Om en estimator inte är en opartisk uppskattare är den en partisk uppskattare. Även om en partisk uppskattare inte har en bra anpassning av dess förväntade värde med sin parameter, finns det många praktiska fall då en partisk uppskattare kan vara användbar. Ett sådant fall är när ett konfidensintervall med plus fyra används för att konstruera ett konfidensintervall för en befolkningsandel.

Exempel för medel

För att se hur denna idé fungerar kommer vi att undersöka ett exempel som avser medelvärdet. Statistiken

(X1 + X2 +... + Xn) / N

är känt som provmedlet. Vi antar att de slumpmässiga variablerna är ett slumpmässigt prov från samma fördelning med medel μ. Detta betyder att det förväntade värdet för varje slumpmässig variabel är μ.

När vi beräknar det förväntade värdet på vår statistik ser vi följande:

EX1 + X2 +... + Xn) / n] = (E [X1] + E [X2] +… + E [Xn]) / n = (nE [X1]) / n = E [X1] = μ.

Eftersom det förväntade värdet för statistiken matchar den parameter som den uppskattade innebär detta att provmedlet är en opartisk uppskattning för befolkningsmedlet.