Inferentialstatistik får sitt namn från vad som händer i denna statistikgren. I stället för att bara beskriva en uppsättning data försöker inferentialstatistiken dra slutsatsen om en befolkning på grundval av ett statistiskt urval. Ett specifikt mål i inferentialstatistik inbegriper bestämningen av värdet på en okänd populationsparameter. Området värden som vi använder för att uppskatta denna parameter kallas ett konfidensintervall.
Ett konfidensintervall består av två delar. Den första delen är uppskattningen av populationsparametern. Vi uppskattar denna uppskattning genom att använda ett enkelt slumpmässigt prov. Från detta prov beräknar vi statistiken som motsvarar den parameter som vi vill uppskatta. Om vi till exempel var intresserade av medelhöjden för alla första klassstudenter i USA, skulle vi använda ett enkelt slumpmässigt urval av amerikanska första klassare, mäta dem alla och sedan beräkna medelhöjden på vårt prov.
Den andra delen av ett konfidensintervall är felmarginen. Detta är nödvändigt eftersom vår uppskattning enbart kan skilja sig från det verkliga värdet på populationsparametern. För att möjliggöra andra potentiella värden för parametern måste vi producera ett antal nummer. Felmarginen gör detta och varje konfidensintervall är av följande form:
Uppskatta ± Felmarginal
Uppskattningen är i mitten av intervallet, och sedan subtraherar vi och lägger till felmarginen från denna uppskattning för att få ett intervall av värden för parametern.
Till varje förtroendeintervall fästs en nivå av förtroende. Detta är en sannolikhet eller procent som indikerar hur mycket säkerhet vi borde tillskrivas vårt förtroendeintervall. Om alla andra aspekter av en situation är identiska, desto högre konfidensnivå desto bredare konfidensintervall.
Denna nivå av förtroende kan leda till viss förvirring. Det är inte ett uttalande om provtagningsförfarandet eller populationen. Istället ger det en indikation på framgången för processen med att bygga ett förtroendeintervall. Till exempel kommer konfidensintervall med förtroende på 80 procent på lång sikt att missa den verkliga befolkningsparametern en av var femte gånger.
Alla siffror från noll till ett kan i teorin användas för en konfidensnivå. I praktiken är 90 procent, 95 procent och 99 procent alla vanliga förtroendegrader.
Felmarginal för en konfidensnivå bestäms av ett par faktorer. Vi kan se detta genom att undersöka formeln för felmarginal. En felmarginal är av formen:
Felmarginal = (Statistik för förtroendegrad) * (Standardavvikelse / fel)
Statistiken för konfidensnivån beror på vilken sannolikhetsfördelning som används och vilken nivå av förtroende vi har valt. Till exempel om Cär vår förtroendegrad och vi arbetar då med en normal distribution C är området under kurvan mellan -z* till z*. Detta nummer z* är siffran i vår formel för felmarginal.
Den andra termen som behövs i vår felmarginal är standardavvikelsen eller standardfelet. Här föredras standardavvikelsen för distributionen som vi arbetar med. Parametrar från populationen är emellertid okända. Detta nummer är vanligtvis inte tillgängligt när man skapar konfidensintervall i praktiken.
För att hantera denna osäkerhet när vi känner till standardavvikelsen använder vi istället standardfelet. Standardfelet som motsvarar en standardavvikelse är en uppskattning av denna standardavvikelse. Det som gör standardfelet så kraftfullt är att det beräknas utifrån det enkla slumpmässiga provet som används för att beräkna vår uppskattning. Ingen extra information är nödvändig eftersom provet gör alla uppskattningar för oss.
Det finns en mängd olika situationer som kräver förtroendeintervaller. Dessa konfidensintervall används för att uppskatta ett antal olika parametrar. Även om dessa aspekter är olika, förenas alla dessa förtroendeintervaller med samma övergripande format. Några vanliga konfidensintervall är de för ett befolkningsmedelvärde, befolkningsvarians, befolkningsandel, skillnaden mellan två befolkningsmedel och skillnaden mellan två befolkningsförhållanden.