Vad är paneldata?

Paneldata, även kända som longitudinella data eller tvärsnittsseriedata i vissa speciella fall, är data som härrör från ett (vanligtvis litet) antal observationer över tid på ett (vanligtvis stort) antal tvärsnittsenheter som individer , hushåll, företag eller regeringar.

I disciplinerna för ekonometrik och statistik avser paneldata multidimensionell data som vanligtvis innebär mätningar under en viss tidsperiod. Som sådan består paneldata av forskarens observationer av många fenomen som samlades in under flera tidsperioder för samma grupp enheter eller enheter. Exempelvis kan en paneldataset vara en som följer ett givet urval av individer över tid och registrerar observationer eller information om varje individ i provet.

Grundläggande exempel på paneldata

Följande är mycket grundläggande exempel på två paneldata för två till tre individer under flera år där de insamlade eller observerade uppgifterna inkluderar inkomst, ålder och kön:

Paneldatauppsättning A

Person

År Inkomst Ålder Sex
1 2013 20 tusen 23 F
1 2014 25 tusen 24 F
1 2015 27.500 25 F
2 2013 35 tusen 27 M
2 2014 42.500 28 M
2 2015 50 tusen 29 M

Paneldatauppsättning B

Person

År Inkomst Ålder Sex
1 2013 20 tusen 23 F
1 2014 25 tusen 24 F
2 2013 35 tusen 27 M
2 2014 42.500 28 M
2 2015 50 tusen 29 M
3 2014 46 tusen 25 F

Både paneldata A och paneldata B ovan visar de insamlade uppgifterna (egenskaperna för inkomst, ålder och kön) under flera år för olika personer. Paneldatauppsättning A visar data som samlats in för två personer (person 1 och person 2) under tre år (2013, 2014 och 2015). Detta exempeluppsättning skulle betraktas som en balanserad panel eftersom varje person observeras för de definierade egenskaperna för inkomst, ålder och kön varje studieår. Panel Data Set B, å andra sidan, skulle betraktas som en obalanserad panel eftersom data inte finns för varje person varje år. Egenskaper hos person 1 och person 2 samlades in 2013 och 2014, men person 3 observerades endast 2014, inte 2013 och 2014. 

Analys av paneldata i ekonomisk forskning

Det finns två distinkta uppsättningar information som kan härledas från tidsseriedata för tvärsnitt. Tvärsnittskomponenten i datauppsättningen återspeglar skillnaderna som observerats mellan de enskilda försökspersonerna eller enheterna medan tidsseriekomponenten som återspeglar skillnaderna som observerats för ett ämne över tid. Till exempel kunde forskare fokusera på skillnaderna i data mellan varje person i en panelstudie och / eller förändringarna i observerade fenomen för en person under studiens gång (t.ex. förändringarna i inkomst över tid för person 1 i paneldata Ställ in A ovan).

Det är paneldata-regressionsmetoder som tillåter ekonomer att använda dessa olika uppsättningar information som tillhandahålls av paneldata. Som sådan kan analys av paneldata bli extremt komplex. Men denna flexibilitet är just fördelen med paneldata för ekonomisk forskning i motsats till konventionella tvärsnitts- eller tidsseriedata. Paneldata ger forskare ett stort antal unika datapunkter, vilket ökar forskarens grad av frihet att utforska förklarande variabler och relationer.