I statistik används termen population för att beskriva ämnena i en viss studie - allt eller alla som är föremål för en statistisk observation. Befolkningar kan vara stora eller små i storlek och definieras av valfritt antal egenskaper, även om dessa grupper vanligtvis definieras specifikt snarare än vagt - till exempel en befolkning av kvinnor över 18 som köper kaffe på Starbucks snarare än en befolkning av kvinnor över 18.
Statistiska populationer används för att observera beteenden, trenderna och mönstren i hur individer i en definierad grupp interagerar med världen runt dem, vilket gör att statistiker kan dra slutsatser om egenskaperna hos undersöksämnen, även om dessa personer oftast är människor, djur och växter och till och med föremål som stjärnor.
Australian Government Bureau of Statistics konstaterar:
Det är viktigt att förstå målpopulationen som studeras, så att du kan förstå vem eller vad informationen hänvisar till. Om du inte tydligt har definierat vem eller vad du vill ha i din befolkning kan du sluta med data som inte är användbara för dig.
Det finns naturligtvis vissa begränsningar när det gäller att studera populationer, främst genom att det är sällsynt att kunna observera alla individerna i en viss grupp. Av denna anledning studerar forskare som använder statistik även subpopulationer och tar statistiska prover av små delar av större populationer för att mer exakt analysera hela spektrumet av beteenden och egenskaper hos befolkningen i stort.
En statistisk population är alla grupper av individer som är föremål för en studie, vilket innebär att nästan vad som helst kan utgöra en population så länge individerna kan grupperas ihop med ett gemensamt drag, eller ibland två gemensamma drag. Till exempel, i en studie som försöker bestämma medelvikten för alla 20-åriga män i USA, skulle befolkningen vara alla 20-åriga män i USA.
Ett annat exempel är en studie som undersöker hur många människor som bor i Argentina där befolkningen skulle vara varje person som bor i Argentina, oavsett medborgarskap, ålder eller kön. Däremot befolkningen i en separat studie som frågade hur många män under 25 som bodde i Argentina kan vara alla män som är 24 år och under som bor i Argentina oavsett medborgarskap.
Statistiska populationer kan vara lika vaga eller specifika som statistikernas önskemål; det beror i slutändan på målet för den forskning som bedrivs. En koodlare skulle inte vilja veta statistiken över hur många röda kvinnliga kor han äger; istället skulle han vilja veta uppgifterna om hur många kvinnliga kor han har som fortfarande kan producera kalvar. Den bonden skulle vilja välja den senare som sin studiepopulation.
Det finns många sätt du kan använda befolkningsdata i statistik. StatisticsShowHowto.com förklarar ett roligt scenario där du motstår frestelse och går in i en godisaffär, där ägaren kanske erbjuder ett par prover av hennes produkter. Du skulle äta en godis från varje prov; du skulle inte vilja äta ett prov av varje godis i butiken. Det skulle kräva provtagning från hundratals burkar och sannolikt skulle du bli ganska sjuk. Istället förklarar den statistiska webbplatsen:
"Du kan basera din åsikt om hela butikens godislinje på (bara) proverna de har att erbjuda. Samma logik gäller för de flesta undersökningar i statistik. Du kommer bara att vilja ta ett urval av hela befolkningen ( "Befolkning" i detta exempel skulle vara hela godisgränsen). Resultatet är en statistik om den befolkningen. "
Den australiensiska regeringens statistikbyrå ger ett par andra exempel som har ändrats något här. Föreställ dig att du bara vill studera människor som bor i USA som föddes utomlands - ett hett politiskt ämne idag mot bakgrund av den heta nationella debatten om invandring. Men istället såg du av misstag på alla människor som är födda i detta land. Uppgifterna inkluderar många människor du inte vill studera. "Du kan hamna med data som du inte behöver eftersom din målpopulation inte var klart definierad, konstaterar statistikbyrån.
En annan relevant studie kan vara en titt på alla grundskolebarn som dricker läsk. Du måste tydligt definiera målpopulationen som "grundskolebarn" och "de som dricker sodapop", annars kan du sluta med data som inkluderade alla skolbarn (inte bara elever i grundskolan) och / eller alla de som dricker läsk. Att inkludera äldre barn och / eller de som inte dricker läskpopp skulle snedvrida dina resultat och sannolikt göra studien oanvändbar.
Även om den totala befolkningen är vad forskarna vill studera, är det mycket sällsynt att kunna utföra en folkräkning för varje enskild medlem av befolkningen. På grund av begränsningar av resurser, tid och tillgänglighet är det nästan omöjligt att utföra en mätning på varje ämne. Som ett resultat använder många statistiker, samhällsvetare och andra inferensstatistik, där forskare bara kan studera en liten del av befolkningen och fortfarande observera konkreta resultat.
Istället för att utföra mätningar på varje medlem av befolkningen, överväger forskare en delmängd av denna befolkning som kallas ett statistiskt prov. Dessa prover ger mätningar av individerna som berättar forskare om motsvarande mätningar i befolkningen, som sedan kan upprepas och jämföras med olika statistiska prover för att mer exakt beskriva hela populationen.
Frågan om vilken delmängd av befolkningen som ska väljas är då mycket viktig i statistikstudien, och det finns många olika sätt att välja ett urval, av vilka många inte ger några meningsfulla resultat. Av denna anledning är forskare ständigt på jakt efter potentiella subpopulationer eftersom de vanligtvis får bättre resultat när de känner igen blandningen av typer av individer i de populationer som studeras.
Olika provtagningstekniker, såsom bildning av stratifierade prover, kan hjälpa till att hantera subpopulationer, och många av dessa tekniker antar att en specifik typ av prov, kallad ett enkelt slumpmässigt prov, har valts från populationen.