Chi-kvadratisk godhet för passningstest är en variation av det mer allmänna chi-kvadratiska testet. Inställningen för detta test är en enda kategorisk variabel som kan ha många nivåer. Ofta i denna situation kommer vi att ha en teoretisk modell i åtanke för en kategorisk variabel. Genom denna modell förväntar vi oss att vissa andelar av befolkningen faller in i var och en av dessa nivåer. En god passformstest avgör hur väl de förväntade proportionerna i vår teoretiska modell matchar verkligheten.
Noll- och alternativa hypoteser för en god passformtest ser annorlunda ut än några av våra andra hypotestest. En anledning till detta är att en chi-kvadratisk passform är en icke-parametrisk metod. Detta innebär att vårt test inte gäller en enda populationsparameter. Nollhypotesen anger således inte att en enda parameter får ett visst värde.
Vi börjar med en kategorisk variabel med n nivåer och låt pjag vara andelen av befolkningen på nivå jag. Vår teoretiska modell har värden på qjag för var och en av proportionerna. Uttalandet av noll- och alternativa hypoteser är följande:
Beräkningen av en chi-kvadratstatistik innebär en jämförelse mellan faktiska räkningar av variabler från data i vårt enkla slumpmässiga prov och de förväntade räkningarna för dessa variabler. De faktiska räkningarna kommer direkt från vårt prov. Hur de förväntade räkningarna beräknas beror på det specifika chi-kvadratiska testet som vi använder.
För en bra passformtest har vi en teoretisk modell för hur våra data ska stå i proportion. Vi multiplicerar helt enkelt dessa proportioner med provstorleken n för att få våra förväntade räkningar.
Chi-kvadratstatistiken för passformtestens godhet bestäms genom att jämföra de faktiska och förväntade räkningarna för varje nivå i vår kategoriska variabel. Stegen för att beräkna chi-kvadratstatistiken för ett bra passformtest är följande:
Om vår teoretiska modell matchar de observerade data perfekt, kommer de förväntade räkningarna inte att visa någon avvikelse från de observerade räkningarna för vår variabel. Detta kommer att innebära att vi har en chi-kvadratstatistik på noll. I alla andra situationer är chi-square-statistiken ett positivt tal.
Antalet frihetsgrader kräver inga svåra beräkningar. Allt vi behöver göra är att subtrahera en från antalet nivåer i vår kategoriska variabel. Detta nummer kommer att informera oss om vilken av de oändliga chi-kvadratfördelningarna vi ska använda.
Chi-square-statistiken som vi beräknade motsvarar en viss plats på en chi-square-fördelning med lämpligt antal frihetsgrader. P-värdet bestämmer sannolikheten för att få en teststatistik detta extrema, förutsatt att nollhypotesen är sann. Vi kan använda en tabell över värden för en chi-kvadratfördelning för att bestämma p-värdet för vårt hypotestest. Om vi har statistisk mjukvara tillgänglig kan detta användas för att få en bättre uppskattning av p-värdet.
Vi fattar vårt beslut om att avvisa nollhypotesen baserad på en förutbestämd nivå av betydelse. Om vårt p-värde är mindre än eller lika med denna nivå av betydelse, avvisar vi nollhypotesen. Annars misslyckas vi med att avvisa nollhypotesen.