En introduktion till Akaikes informationskriterium (AIC)

De Akaike informationskriterium (kallas ofta helt enkelt som AIC) är ett kriterium för att välja bland kapslade statistiska eller ekonometriska modeller. AIC är i huvudsak ett uppskattat mått på kvaliteten på var och en av de tillgängliga ekonometriska modellerna eftersom de hänför sig till varandra för en viss uppsättning data, vilket gör den till en idealisk metod för modellval.

Använda AIC för statistisk och ekonometrisk modellval

Akaike Information Criterion (AIC) utvecklades med en grund i informationsteori. Informationsteori är en gren av tillämpad matematik som rör kvantifiering (processen för att räkna och mäta) av information. Vid användning av AIC för att försöka mäta den relativa kvaliteten på ekonometriska modeller för en given datamängd, ger AIC forskaren en uppskattning av den information som skulle gå förlorad om en viss modell skulle användas för att visa processen som producerade data. Som sådan arbetar AIC för att balansera avvägningarna mellan komplexiteten hos en given modell och dess god passform, vilket är den statistiska termen för att beskriva hur bra modellen "passar" data eller uppsättning observationer.

Vad AIC inte kommer att göra

På grund av vad Akaike Information Criterion (AIC) kan göra med en uppsättning statistiska och ekonometriska modeller och en given uppsättning data, är det ett användbart verktyg i modellval. Men även som ett modellvalverktyg har AIC sina begränsningar. Till exempel kan AIC endast tillhandahålla ett relativt test av modellkvalitet. Det vill säga att AIC inte och inte kan tillhandahålla ett test av en modell som resulterar i information om modellens kvalitet i absolut mening. Så om var och en av de testade statistiska modellerna är lika otillfredsställande eller dåliga för data, skulle AIC inte ge någon indikation från början.

AIC i ekonometriska termer

AIC är ett nummer associerat med varje modell:

AIC = ln (sm2) + 2 m / T

Var m är antalet parametrar i modellen, och sm2 (i ett AR (m) -exempel) är den uppskattade restvariansen: sm2 = (summan av kvadratrester för modell m) / T. Det är den genomsnittliga kvadratiska återstoden för modellen m.

Kriteriet kan minimeras över val av m att bilda en avvägning mellan modellens passform (som sänker summan av kvadratrester) och modellens komplexitet, som mäts med m. Således kan en AR (m) -modell jämfört med en AR (m + 1) jämföras med detta kriterium för en given databas.

En ekvivalent formulering är den här: AIC = T ln (RSS) + 2K där K är antalet regressorer, T antalet observationer och RSS den återstående summan av kvadrater; minimera över K för att välja K.

Som sådan, förutsatt en uppsättning av ekonometriska modeller, kommer den föredragna modellen med avseende på relativ kvalitet att vara modellen med det lägsta AIC-värdet.