Ett av målen med statistik är att ordna data på ett meningsfullt sätt. Tvåvägstabeller är ett viktigt sätt att organisera en viss typ av parade data. Liksom med konstruktionen av grafer eller tabeller i statistik är det mycket viktigt att känna till vilka typer av variabler vi arbetar med. Om vi har kvantitativa data, bör ett diagram som histogram eller stam- och bladdiagram användas. Om vi har kategoriska data, är ett stapeldiagram eller cirkeldiagram lämpligt.
När vi arbetar med parade data måste vi vara försiktiga. En spridningsdiagram finns för parade kvantitativa data, men vilken typ av graf finns för parade kategoriska data? När vi har två kategoriska variabler, bör vi använda en tvåvägstabell.
Först minns vi att kategoriska data hänför sig till drag eller kategorier. Det är inte kvantitativt och har inte numeriska värden.
En tvåvägstabell innefattar en lista över alla värden eller nivåer för två kategoriska variabler. Alla värden för en av variablerna listas i en vertikal kolumn. Värdena för den andra variabeln listas längs en horisontell rad. Om den första variabeln har m och den andra variabeln har n värden, då kommer det att finnas totalt mn poster i tabellen. Var och en av dessa poster motsvarar ett visst värde för var och en av de två variablerna.
Längs varje rad och längs varje kolumn är anteckningarna totalt. Dessa totaler är viktiga vid bestämning av marginella och villkorade fördelningar. Dessa totaler är också viktiga när vi genomför ett chi-square test för oberoende.
Till exempel kommer vi att överväga en situation där vi tittar på flera delar av en statistikkurs vid ett universitet. Vi vill konstruera en tvåvägstabell för att bestämma vilka skillnader, i förekommande fall, mellan män och kvinnor i banan. För att uppnå detta räknar vi antalet för varje bokstavsgrad som tjänades av medlemmar av varje kön.
Vi noterar att den första kategoriska variabeln är den för kön, och det finns två möjliga värden i studien av manliga och kvinnliga. Den andra kategoriska variabeln är den för bokstavsklass, och det finns fem värden som ges av A, B, C, D och F. Detta innebär att vi kommer att ha en tvåvägstabell med 2 x 5 = 10 poster, plus en ytterligare rad och en ytterligare kolumn som kommer att behövas för att tabellera rad- och kolumnsummans totala.
Vår undersökning visar att:
Denna information matas in i tvåvägstabellen nedan. Totalt för varje rad berättar hur många av varje typ av betyg som tjänades. Kolumnens totala tal visar antalet män och antalet kvinnor.
Tvåvägstabeller hjälper till att organisera våra data när vi har två kategoriska variabler. Denna tabell kan användas för att hjälpa oss att jämföra mellan två olika grupper i våra data. Vi kan till exempel ta hänsyn till mäns relativa prestanda i statistikbanan mot kvinnors prestanda på banan.
Efter att ha skapat en tvåvägstabell kan nästa steg vara att analysera data statistiskt. Vi kan fråga om variablerna i studien är oberoende av varandra eller inte. För att svara på denna fråga kan vi använda ett chi-kvadrat-test i tvåvägstabellen.
Manlig | Kvinna | Total | |
EN | 50 | 60 | 110 |
B | 60 | 80 | 140 |
C | 100 | 50 | 150 |
D | 40 | 50 | 90 |
F | 30 | 20 | 50 |
Total | 280 | 260 | 540 |