Ibland i statistik är det bra att se utarbetade exempel på problem. Dessa exempel kan hjälpa oss att ta reda på liknande problem. I den här artikeln kommer vi att gå igenom processen för att genomföra inferensiell statistik för ett resultat som rör två befolkningsmedel. Inte bara kommer vi att se hur man utför ett hypotest om skillnaden mellan två populationsmedel, vi kommer också att konstruera ett konfidensintervall för denna skillnad. Metoderna som vi använder kallas ibland ett tvåprov t-test och ett konfidensintervall för två prov t.
Anta att vi vill testa skolbarns matematiska lämplighet. En fråga som vi kan ha är om högre klassnivåer har högre genomsnittliga testresultat.
Ett enkelt slumpmässigt urval av 27 tredje klassare får ett mattest, deras svar poängsätts och resultaten har visat sig ha en genomsnittlig poäng på 75 poäng med ett provstandardavvikelse på 3 poäng.
Ett enkelt slumpmässigt prov på 20 femte klassare får samma matteprov och deras svar får poäng. Medelpoäng för femte klassare är 84 poäng med ett standardavvikelse på 5 poäng.
Med tanke på detta scenario ställer vi följande frågor:
Vi måste välja vilken procedur vi ska använda. När vi gör detta måste vi se till att kontrollera att villkoren för denna procedur är uppfyllda. Vi uppmanas att jämföra två befolkningsmedel. En samling metoder som kan användas för att göra detta är de som används för tvåprov-t-procedurer.
För att använda dessa t-procedurer för två prover måste vi se till att följande villkor gäller:
Vi ser att de flesta av dessa villkor är uppfyllda. Vi fick höra att vi har enkla slumpmässiga prover. Befolkningarna som vi studerar är stora eftersom det finns miljoner elever på dessa lönegrader.
Villkoret för att vi inte automatiskt kan anta är om testresultaten normalt distribueras. Eftersom vi har en tillräckligt stor provstorlek behöver vi inte nödvändigtvis att variabeln ska distribueras normalt genom robustiteten i våra t-procedurer..
Eftersom villkoren är uppfyllda utför vi ett par preliminära beräkningar.
Standardfelet är en uppskattning av en standardavvikelse. För denna statistik lägger vi till provvariansen för proverna och tar sedan kvadratroten. Detta ger formeln:
(s1 2 / n1 + s22 / n2)1/2
Genom att använda värdena ovan ser vi att värdet på standardfelet är