I inferentialstatistik förlitar sig konfidensintervaller för befolkningsförhållanden på den normala normala fördelningen för att bestämma okända parametrar för en given population givet ett statistiskt urval av befolkningen. En anledning till detta är att för lämpliga provstorlekar gör normal normalfördelning ett utmärkt jobb med att uppskatta en binomialfördelning. Detta är anmärkningsvärt eftersom även om den första distributionen är kontinuerlig, den andra är diskret.
Det finns ett antal frågor som måste tas upp när du bygger konfidensintervall för proportioner. En av dessa handlar om vad som kallas ett "plus fyra" konfidensintervall, vilket resulterar i en partisk uppskattning. Men denna uppskattare av en okänd befolkningsandel står bättre i vissa situationer än opartiska uppskattare, särskilt de situationer där det inte finns några framgångar eller misslyckanden i uppgifterna.
I de flesta fall är det bästa försöket att uppskatta en befolkningsandel att använda en motsvarande urvalsproportion. Vi antar att det finns en befolkning med en okänd andel p av dess individer som innehåller ett visst drag, då bildar vi ett enkelt slumpmässigt urval av storlek n från denna befolkning.Av dessa n individer, vi räknar antalet dem Y som har den egenskap vi är nyfiken på. Nu uppskattar vi p genom att använda vårt prov. Provets andel Y / n är en opartisk uppskattning av p.
När vi använder ett plus-fyra intervall, ändrar vi uppskattaren av p. Vi gör detta genom att lägga till fyra till det totala antalet observationer och därmed förklara frasen ”plus fyra.” Vi delar sedan dessa fyra observationer mellan två hypotetiska framgångar och två misslyckanden, vilket innebär att vi lägger till två till det totala antalet framgångar. slutresultatet är att vi ersätter varje instans av Y / n med (Y + 2) / (n + 4), och ibland betecknas denna bråk med p med en sida ovanför.
Proportandelen fungerar vanligtvis mycket bra för att uppskatta en befolkningsandel. Men det finns vissa situationer där vi måste ändra vår uppskattare något. Statistisk praxis och matematisk teori visar att modifieringen av intervallet plus fyra är lämpligt för att uppnå detta mål.
En situation som borde få oss att överväga ett plus-fyra intervall är ett löpande prov. På grund av att befolkningsandelen är så liten eller så stor är provandelen också mycket nära 0 eller mycket nära 1. I den här typen av situationer bör vi överväga ett intervall med fyra plus.
Ett annat skäl för att använda ett intervall på plus fyra är om vi har en liten provstorlek. Ett plus fyra intervall i denna situation ger en bättre uppskattning för en befolkningsandel än att använda det typiska konfidensintervallet för en andel.
Konfidensintervallet plus fyra är ett nästan magiskt sätt att beräkna inferensstatistik mer exakt genom att helt enkelt lägga till fyra imaginära observationer till en given datauppsättning, två framgångar och två misslyckanden, det är i stånd att mer exakt förutsäga andelen av en datamängd som passar parametrarna.
Men konfidensintervallet plus-fyra är inte alltid tillämpligt för alla problem. Det kan endast användas när konfidensintervallet för en datauppsättning är över 90% och befolkningsstorleken är minst 10. Men datauppsättningen kan innehålla valfritt antal framgångar och misslyckanden, även om det fungerar bättre när där är antingen inga framgångar eller inga misslyckanden i någon given befolknings data.
Tänk på att till skillnad från beräkningarna av vanlig statistik, beror beräkningarna för inferensstatistik på ett urval av data för att bestämma de mest troliga resultaten inom en population. Även om plus-fyra konfidensintervall korrigerar för en större felmarginal, måste denna marginal fortfarande tas in för att ge den mest exakta statistiska observationen.