Ett av de många sätten variabler i statistik kan klassificeras är att ta hänsyn till skillnaderna mellan förklarande och responsvariabler. Även om dessa variabler är relaterade, finns det viktiga skillnader mellan dem. Efter att ha definierat dessa typer av variabler, kommer vi att se att korrekt identifiering av dessa variabler har ett direkt inflytande på andra aspekter av statistik, såsom konstruktionen av en spridplot och lutningen för en regressionslinje.
Vi börjar med att titta på definitionerna av dessa typer av variabler. En svarsvariabel är en viss mängd som vi ställer en fråga om i vår studie. En förklarande variabel är alla faktorer som kan påverka svarsvariabeln. Även om det kan finnas många förklarande variabler, kommer vi främst att handla om en enda förklaringsvariabel.
En svarsvariabel kanske inte finns i en studie. Namnet på denna typ av variabel beror på de frågor som ställs av en forskare. Genomförandet av en observationsstudie skulle vara ett exempel på ett exempel när det inte finns en svarsvariabel. Ett experiment kommer att ha en svarsvariabel. Den försiktiga utformningen av ett experiment försöker konstatera att förändringarna i en svarsvariabel direkt orsakas av förändringar i de förklarande variablerna.
För att utforska dessa koncept kommer vi att undersöka några exempel. För det första exemplet, anta att en forskare är intresserad av att studera humör och attityder hos en grupp förstaårsstudenter. Alla förstaårsstudenter får en serie frågor. Dessa frågor är utformade för att bedöma graden av hemlängt hos en student. Studenterna anger också i undersökningen hur långt deras högskola är hemifrån.
En forskare som undersöker dessa uppgifter kanske bara är intresserad av typen av studentersvar. Kanske är orsaken till detta att ha en övergripande känsla för sammansättningen av en ny nybörjare. I det här fallet finns det ingen svarsvariabel. Det beror på att ingen ser om värdet på en variabel påverkar värdet på en annan.
En annan forskare kunde använda samma data för att försöka svara om elever som kom längre bort hade en större grad av hemlängtan. I det här fallet är data som hänför sig till hemlängesfrågorna värdena på en svarsvariabel, och data som anger avståndet hemifrån utgör den förklarande variabel.
För det andra exemplet kan vi vara nyfikna om antalet timmar som läggs på läxor har en effekt på betyg som en student tjänar på en tentamen. I det här fallet, eftersom vi visar att värdet på en variabel ändrar värdet på en annan, finns det en förklarande och en svarsvariabel. Antalet studerade timmar är den förklarande variabeln och poängen på testet är svarsvariabeln.
När vi arbetar med parade kvantitativa data är det lämpligt att använda en spridplot. Syftet med denna typ av graf är att demonstrera förhållanden och trender inom de parade data. Vi behöver inte ha både en förklarande och svarsvariabel. Om detta är fallet, kan endera variabelen plottas längs endera axeln. I händelse av att det finns ett svar och en förklaringsvariabel, ritas emellertid alltid förklaringsvariabeln längs med x eller horisontell axel för ett kartesiskt koordinatsystem. Svarsvariabeln plottas sedan längs y axel.
Skillnaden mellan förklarande och responsvariabler liknar en annan klassificering. Ibland hänvisar vi till variabler som oberoende eller beroende. Värdet på en beroende variabel förlitar sig på en oberoende variabel. Således motsvarar en svarsvariabel en beroende variabel medan en förklarande variabel motsvarar en oberoende variabel. Denna terminologi används vanligtvis inte i statistik eftersom den förklarande variabeln inte är riktigt oberoende. I stället tar variabeln bara värden som observeras. Vi har kanske ingen kontroll över värdena på en förklarande variabel.