Ett av statistikmålen är organisering och visning av data. Ett sätt att göra detta är många gånger att använda ett diagram, diagram eller tabell. När du arbetar med parade data är en användbar typ av diagram en spridningsdiagram. Denna typ av graf gör det möjligt för oss att enkelt och effektivt utforska våra data genom att undersöka en spridning av punkter i planet.
Det är värt att lyfta fram att en spridningsdiagram är en typ av diagram som används för parade data. Detta är en typ av datauppsättning där var och en av våra datapunkter har två nummer associerade med den. Vanliga exempel på sådana parningar inkluderar:
Den tomma duken som vi börjar med för vår spridplot är det kartesiska koordinatsystemet. Detta kallas också det rektangulära koordinatsystemet på grund av att varje punkt kan placeras genom att rita en viss rektangel. Ett rektangulärt koordinatsystem kan skapas av:
Nu kan vi plotta våra datapunkter. Det första numret i vårt par är x-samordna. Det är det horisontella avståndet från y-axeln och därmed också ursprunget. Vi går till höger för positiva värden på x och till vänster om ursprunget för negativa värden på x.
Det andra numret i vårt par är y-samordna. Det är det vertikala avståndet från x-axeln. Från och med den ursprungliga punkten på x-axel, gå upp för positiva värden på y och ned för negativa värden på y.
Platsen på vår graf markeras sedan med en prick. Vi upprepar denna process om och om igen för varje punkt i vår datauppsättning. Resultatet är en spridning av punkter, vilket ger scatterplot sitt namn.
En viktig instruktion som återstår är att vara försiktig med vilken variabel som är på vilken axel. Om våra parade data består av en förklarande och svarparning anges den förklarande variabeln på x-axeln. Om båda variablerna anses vara förklarande, kan vi välja vilken som ska plottas på x-axeln och vilken på y-axel.
Det finns flera viktiga funktioner i en scatterplot. Genom att identifiera dessa egenskaper kan vi avslöja mer information om vår datauppsättning. Dessa funktioner inkluderar:
Scatterplots som uppvisar en linjär trend kan analyseras med de statistiska teknikerna för linjär regression och korrelation. Regression kan utföras för andra typer av trender som är olinjära.