Paneldata, även kända som longitudinella data eller tvärsnittsseriedata i vissa speciella fall, är data som härrör från ett (vanligtvis litet) antal observationer över tid på ett (vanligtvis stort) antal tvärsnittsenheter som individer , hushåll, företag eller regeringar.
I disciplinerna för ekonometrik och statistik avser paneldata multidimensionell data som vanligtvis innebär mätningar under en viss tidsperiod. Som sådan består paneldata av forskarens observationer av många fenomen som samlades in under flera tidsperioder för samma grupp enheter eller enheter. Exempelvis kan en paneldataset vara en som följer ett givet urval av individer över tid och registrerar observationer eller information om varje individ i provet.
Följande är mycket grundläggande exempel på två paneldata för två till tre individer under flera år där de insamlade eller observerade uppgifterna inkluderar inkomst, ålder och kön:
Paneldatauppsättning A
Person | År | Inkomst | Ålder | Sex |
1 | 2013 | 20 tusen | 23 | F |
1 | 2014 | 25 tusen | 24 | F |
1 | 2015 | 27.500 | 25 | F |
2 | 2013 | 35 tusen | 27 | M |
2 | 2014 | 42.500 | 28 | M |
2 | 2015 | 50 tusen | 29 | M |
Paneldatauppsättning B
Person | År | Inkomst | Ålder | Sex |
1 | 2013 | 20 tusen | 23 | F |
1 | 2014 | 25 tusen | 24 | F |
2 | 2013 | 35 tusen | 27 | M |
2 | 2014 | 42.500 | 28 | M |
2 | 2015 | 50 tusen | 29 | M |
3 | 2014 | 46 tusen | 25 | F |
Både paneldata A och paneldata B ovan visar de insamlade uppgifterna (egenskaperna för inkomst, ålder och kön) under flera år för olika personer. Paneldatauppsättning A visar data som samlats in för två personer (person 1 och person 2) under tre år (2013, 2014 och 2015). Detta exempeluppsättning skulle betraktas som en balanserad panel eftersom varje person observeras för de definierade egenskaperna för inkomst, ålder och kön varje studieår. Panel Data Set B, å andra sidan, skulle betraktas som en obalanserad panel eftersom data inte finns för varje person varje år. Egenskaper hos person 1 och person 2 samlades in 2013 och 2014, men person 3 observerades endast 2014, inte 2013 och 2014.
Det finns två distinkta uppsättningar information som kan härledas från tidsseriedata för tvärsnitt. Tvärsnittskomponenten i datauppsättningen återspeglar skillnaderna som observerats mellan de enskilda försökspersonerna eller enheterna medan tidsseriekomponenten som återspeglar skillnaderna som observerats för ett ämne över tid. Till exempel kunde forskare fokusera på skillnaderna i data mellan varje person i en panelstudie och / eller förändringarna i observerade fenomen för en person under studiens gång (t.ex. förändringarna i inkomst över tid för person 1 i paneldata Ställ in A ovan).
Det är paneldata-regressionsmetoder som tillåter ekonomer att använda dessa olika uppsättningar information som tillhandahålls av paneldata. Som sådan kan analys av paneldata bli extremt komplex. Men denna flexibilitet är just fördelen med paneldata för ekonomisk forskning i motsats till konventionella tvärsnitts- eller tidsseriedata. Paneldata ger forskare ett stort antal unika datapunkter, vilket ökar forskarens grad av frihet att utforska förklarande variabler och relationer.