Vad är en Scatterplot?

Ett av statistikmålen är organisering och visning av data. Ett sätt att göra detta är många gånger att använda ett diagram, diagram eller tabell. När du arbetar med parade data är en användbar typ av diagram en spridningsdiagram. Denna typ av graf gör det möjligt för oss att enkelt och effektivt utforska våra data genom att undersöka en spridning av punkter i planet.

Ihopkopplade data

Det är värt att lyfta fram att en spridningsdiagram är en typ av diagram som används för parade data. Detta är en typ av datauppsättning där var och en av våra datapunkter har två nummer associerade med den. Vanliga exempel på sådana parningar inkluderar:

  • En mätning före och efter en behandling. Detta kan ta formen av en elevs prestanda på ett förprov och sedan senare en posttest.
  • En matchande par experimentell design. Här är en individ i kontrollgruppen och en annan liknande person i behandlingsgruppen.
  • Två mätningar från samma individ. Vi kan till exempel registrera hundra personers vikt och höjd.

2D-diagram

Den tomma duken som vi börjar med för vår spridplot är det kartesiska koordinatsystemet. Detta kallas också det rektangulära koordinatsystemet på grund av att varje punkt kan placeras genom att rita en viss rektangel. Ett rektangulärt koordinatsystem kan skapas av:

  1. Börjar med en horisontell sifferrad. Detta kallas x-axel.
  2. Lägg till en vertikal sifferrad. Korsa x-axeln på ett sådant sätt att nollpunkten från båda linjerna skär varandra. Denna andra sifferrad kallas y-axel.
  3. Punkten där nollorna i vår siffrelinje korsar kallas ursprunget.

Nu kan vi plotta våra datapunkter. Det första numret i vårt par är x-samordna. Det är det horisontella avståndet från y-axeln och därmed också ursprunget. Vi går till höger för positiva värden på x och till vänster om ursprunget för negativa värden på x.

Det andra numret i vårt par är y-samordna. Det är det vertikala avståndet från x-axeln. Från och med den ursprungliga punkten på x-axel, gå upp för positiva värden på y och ned för negativa värden på y.

Platsen på vår graf markeras sedan med en prick. Vi upprepar denna process om och om igen för varje punkt i vår datauppsättning. Resultatet är en spridning av punkter, vilket ger scatterplot sitt namn.

Förklarande och svar

En viktig instruktion som återstår är att vara försiktig med vilken variabel som är på vilken axel. Om våra parade data består av en förklarande och svarparning anges den förklarande variabeln på x-axeln. Om båda variablerna anses vara förklarande, kan vi välja vilken som ska plottas på x-axeln och vilken på y-axel.

Funktioner i en Scatterplot

Det finns flera viktiga funktioner i en scatterplot. Genom att identifiera dessa egenskaper kan vi avslöja mer information om vår datauppsättning. Dessa funktioner inkluderar:

  • Den övergripande trenden bland våra variabler. När vi läser från vänster till höger, vad är den stora bilden? Ett uppåtmönster, nedåt eller cykliskt?
  • Eventuella utslag från den övergripande trenden. Är det dessa utslagare från resten av våra data, eller är det inflytelserika punkter?
  • Formen på vilken trend som helst. Är detta linjärt, exponentiellt, logaritmiskt eller något annat?
  • Styrkan i alla trender. Hur nära passar data det övergripande mönstret som vi identifierade?

Relaterade ämnen

Scatterplots som uppvisar en linjär trend kan analyseras med de statistiska teknikerna för linjär regression och korrelation. Regression kan utföras för andra typer av trender som är olinjära.