Korrelation är ett viktigt statistiskt verktyg. Denna metod i statistik kan hjälpa oss att fastställa och beskriva förhållandet mellan två variabler. Vi måste vara noga med att använda och tolka korrelation korrekt. En sådan varning är att alltid komma ihåg att korrelation inte innebär orsakssamband. Det finns andra aspekter av korrelation som vi måste vara försiktiga med. När vi arbetar med korrelation måste vi också vara försiktiga med ekologisk korrelation.
Ekologisk korrelation är en korrelation baserad på medelvärden. Även om detta kan vara till hjälp, och ibland till och med nödvändigt att överväga, måste vi vara försiktiga med att inte anta att denna typ av korrelation också gäller för individer.
Vi kommer att illustrera begreppet ekologisk korrelation och betona att det inte missbrukas genom att titta på några exempel. Ett exempel på en ekologisk korrelation mellan två variabler är antalet år med utbildning och medelinkomst. Vi kan se att dessa två variabler är positivt korrelerade ganska starkt: ju högre antalet år med utbildning, desto större är den genomsnittliga inkomstnivån. Det skulle vara ett misstag att då tro att denna korrelation gäller för enskilda inkomster.
När vi betraktar individer med samma utbildningsnivåer sprids inkomstnivåerna. Om vi skulle konstruera en spridning av dessa data, skulle vi se denna spridning av punkter. Resultatet skulle vara att sambandet mellan utbildning och individuella inkomster skulle vara mycket svagare än korrelationen mellan utbildningsår och genomsnittliga inkomster.
Ett annat exempel på ekologisk korrelation som vi kommer att överväga rör omröstningsmönster och inkomstnivå. På statsnivå tenderar rikare stater att rösta med en högre andel för demokratiska kandidater. Fattigare stater röstar i högre proportioner för republikanska kandidater. För individer förändras denna korrelation. En större del av fattiga individer röstar demokratiska och en större del av rika individer röstar republikaner.
Ett tredje exempel på ekologisk korrelation är när vi tittar på antalet timmar per vecka träning och medelvärde för kroppsmassa. Här är antalet träningstimmar den förklarande variabeln och det genomsnittliga kroppsmassaindexet är svaret. När träningen ökar kan vi förvänta oss att kroppsmassaindexet sjunker. Vi skulle alltså observera en stark negativ korrelation mellan dessa variabler. Men när vi tittar på den individuella nivån skulle korrelationen inte vara lika stark.
Ekologisk korrelation är relaterad till den ekologiska fallacyen och är ett exempel på denna typ av fallacy. Denna typ av logisk felaktig uppgift innebär att ett statistiskt uttalande för en grupp också gäller för individerna i den gruppen. Detta är en form av divisionsfallacy, som felar påståenden som involverar grupper för individer.
Ett annat sätt att ekologiska brister uppträder i statistik är Simpsons paradox. Simpsons paradox hänvisar till jämförelsen mellan två individer eller populationer. Vi kommer att skilja mellan dessa två med A och B. En serie mätningar kan visa att en variabel alltid har ett högre värde för A snarare än B. Men när vi genomsätter värdena på denna variabel, ser vi att B är större än A.
Termen ekologisk är relaterad till ekologi. En användning av termen ekologi är att hänvisa till en viss gren av biologin. Denna del av biologin studerar interaktioner mellan organismer och deras miljö. Detta betraktande av en individ som en del av något mycket större är den betydelsen som denna typ av korrelation heter.