I statistik används graden av frihet för att definiera antalet oberoende kvantiteter som kan tilldelas en statistisk fördelning. Detta tal avser vanligtvis ett positivt heltal som indikerar bristen på begränsningar för en persons förmåga att beräkna saknade faktorer från statistiska problem.
Frihetsgrader fungerar som variabler i den slutliga beräkningen av en statistik och används för att bestämma resultatet av olika scenarier i ett system, och definiera i matematik frihetsgrader antalet dimensioner i en domän som behövs för att bestämma hela vektorn..
För att illustrera begreppet frihetsgrad kommer vi att titta på en grundläggande beräkning av urvalsmedlet, och för att hitta medelvärdet för en lista med data lägger vi till alla data och delar med det totala antalet värden.
Anta ett ögonblick att vi vet att genomsnittet för en datamängd är 25 och att värdena i denna uppsättning är 20, 10, 50 och ett okänt nummer. Formeln för ett provmedelvärde ger oss ekvationen (20 + 10 + 50 + x) / 4 = 25, var x betecknar det okända, med hjälp av någon grundläggande algebra, kan man sedan bestämma att det saknade numret, x, är lika med 20.
Låt oss ändra detta scenario något. Återigen antar vi att vi vet medelvärdet för en datamängd är 25. Men den här gången är värdena i datauppsättningen 20, 10 och två okända värden. Dessa okända kan vara olika, så vi använder två olika variabler, x, och y, att beteckna detta. Den resulterande ekvationen är (20 + 10 + x + y) / 4 = 25. Med en del algebra får vi y = 70- x. Formeln är skriven i denna form för att visa att när vi väljer ett värde för x, värdet för y är helt bestämd. Vi har ett val att göra, och det visar att det finns en frihetsgrad.
Nu ska vi titta på ett provstorlek på hundra. Om vi vet att medelvärdet för denna provdata är 20, men inte känner till värdena på någon av uppgifterna, finns det 99 grader av frihet. Alla värden måste lägga till totalt 20 x 100 = 2000. När vi har värdena på 99 element i datauppsättningen, har den sista bestämts.
Grader av frihet spelar en viktig roll när studenten används t-poängbord. Det finns faktiskt flera t-poäng fördelningar. Vi skiljer mellan dessa fördelningar med användning av frihetsgrader.
Här beror sannolikhetsfördelningen som vi använder på vårt provs storlek. Om vår provstorlek är n, då är antalet frihetsgrader n-1. Exempelvis skulle en provstorlek på 22 kräva att vi använder raden för t-poängbord med 21 frihetsgrader.
Användningen av en chi-square distribution kräver också användning av frihetsgrader. Här på samma sätt som med t-poäng distribution, provstorleken bestämmer vilken distribution som ska användas. Om provstorleken är n, då finns det n-1 grader av frihet.
En annan plats där frihetsgrader dyker upp är formeln för standardavvikelsen. Denna händelse är inte så öppen, men vi kan se den om vi vet vart vi ska titta. För att hitta en standardavvikelse letar vi efter den "genomsnittliga" avvikelsen från medelvärdet. Men efter att ha subtraherat medelvärdet från varje datavärde och kvadrat skillnaderna, slutar vi dock med n-1 hellre än n som vi kan förvänta oss.
Närvaron av n-1 kommer från antalet frihetsgrader. Sedan n datavärden och provmedlet används i formeln finns det n-1 grader av frihet.
Mer avancerade statistiska tekniker använder mer komplicerade sätt att räkna frihetsgraderna. Vid beräkning av teststatistik för två medel med oberoende prover av n1 och n2 element, antalet frihetsgrader har en ganska komplicerad formel. Det kan uppskattas genom att använda den mindre av n1-1 och n2-1
Ett annat exempel på ett annat sätt att räkna frihetsgraderna kommer med en F testa. Vid genomförande av en F test vi har k prover i storlek n-graden av frihet i telleren är k-1 och i nämnaren är k(n-1).