Hypotestest för skillnaden mellan två befolkningsandelar

I den här artikeln kommer vi att gå igenom stegen som krävs för att utföra ett hypotestest, eller test av betydelse, för skillnaden mellan två populationsproportioner. Detta gör att vi kan jämföra två okända proportioner och dra slutsatsen om de inte är lika med varandra eller om en är större än en annan.

Översikt över hypoteser och bakgrund

Innan vi går in på detaljerna i vårt hypotest ska vi titta på ramen för hypotest. I ett test av betydelse försöker vi visa att ett uttalande angående värdet på en populationsparameter (eller ibland befolkningens natur) troligen kommer att vara sant. 

Vi samlar bevis för detta uttalande genom att utföra ett statistiskt prov. Vi beräknar en statistik från detta prov. Värdet på denna statistik är vad vi använder för att bestämma sanningen i det ursprungliga uttalandet. Denna process innehåller osäkerhet, men vi kan kvantifiera denna osäkerhet

Den övergripande processen för ett hypotestest ges av listan nedan:

  1. Se till att villkoren som är nödvändiga för vårt test är uppfyllda.
  2. Ange tydligt noll- och alternativa hypoteser. Den alternativa hypotesen kan involvera ett ensidigt eller ett dubbelsidigt test. Vi bör också bestämma graden av betydelse, som kommer att betecknas med den grekiska bokstaven alfa.
  3. Beräkna teststatistiken. Vilken typ av statistik vi använder beror på det test vi utför. Beräkningen bygger på vårt statistiska urval. 
  4. Beräkna p-värdet. Teststatistiken kan översättas till ett p-värde. Ett p-värde är sannolikheten för att chansen ensam producerar värdet på vår teststatistik under antagandet att nollhypotesen är sann. Den övergripande regeln är att ju mindre p-värdet är, desto större bevis mot nollhypotesen.
  5. Rita en sammanfattning. Slutligen använder vi värdet på alfa som redan valts som ett tröskelvärde. Beslutsregeln är att om p-värdet är mindre än eller lika med alfa, avvisar vi nollhypotesen. Annars misslyckas vi med att avvisa nollhypotesen.

Nu när vi har sett ramen för ett hypotestest kommer vi att se specifikationerna för ett hypotestest för skillnaden mellan två populationsproportioner. 

Villkoren

Ett hypotestest för skillnaden mellan två populationsproportioner kräver att följande villkor är uppfyllda: 

  • Vi har två enkla slumpmässiga prover från stora populationer. Här betyder "stor" att populationen är minst 20 gånger större än provets storlek. Provstorlekarna kommer att betecknas med n1 och n2.
  • Personerna i våra prover har valts oberoende av varandra. Befolkningarna själva måste också vara oberoende.
  • Det finns minst 10 framgångar och 10 misslyckanden i båda våra prover.

Så länge dessa villkor är uppfyllda kan vi fortsätta med vårt hypotest.

Noll och alternativa hypoteser

Nu måste vi ta hänsyn till hypoteserna för vårt test av betydelse. Nollhypotesen är vårt uttalande om ingen effekt. I denna specifika typ av hypotestest är vår nollhypotes att det inte finns någon skillnad mellan de två populationsproportionerna. Vi kan skriva detta som H0: p1 = p2.

Den alternativa hypotesen är en av tre möjligheter, beroende på vad vi testar för: 

  • Henp1 är större än p2. Detta är ett ensidigt eller ensidigt test.
  • Hen: p1 är mindre än p2. Detta är också ensidig test.
  • Hen: p1 är inte lika med p2. Detta är ett två-svansat eller tvåsidig test.

Som alltid, för att vara försiktiga, bör vi använda den tvåsidiga alternativa hypotesen om vi inte har en riktning i åtanke innan vi får vårt prov. Anledningen till detta är att det är svårare att avvisa nollhypotesen med ett dubbelsidigt test.

De tre hypoteserna kan skrivas om genom att ange hur p1 - p2 är relaterad till värdet noll. För att vara mer specifik skulle nollhypotesen bli H0:p1 - p2 = 0. De potentiella alternativa hypoteserna skulle skrivas som:

  • Henp1 - p> 0 motsvarar uttalandet "p1 är större än p2."
  • Henp1 - p< 0 is equivalent to the statement "p1 är mindre än p2."
  • Henp1 - p2  ≠ 0 motsvarar uttalandet "p1 är inte lika med p2."