Ordet "data" visas i hela statistiken. Det finns många olika klassificeringar av data. Data kan vara kvantitativa eller kvalitativa, diskreta eller kontinuerliga. Trots den vanliga användningen av orddata missbrukas de ofta. Det primära problemet med användningen av detta begrepp härrör från brist på kunskap om huruvida orddata är singular eller plural.
Om data är ett enskilt ord, vad är då flertalet av data? Denna fråga är faktiskt fel att ställa. Detta beror på att orddata redan är flertal. Den verkliga frågan vi bör ställa är: "Vad är den enskilda formen av ordet data?" Svaret på denna fråga är "datum."
Det visar sig att detta inträffar av en mycket intressant anledning. För att förklara varför vi måste gå lite djupare in i döda språkens värld.
Vi börjar med historien om ordet datum. Ordet datum kommer från det latinska språket. Datum är ett substantiv, och på latin betyder termen "något som ges." Detta substantiv kommer från det andra försämringen på latin. Detta betyder att alla substantiv i denna form som har en singulär form som slutar med -um har en plural form som slutar i -a. Även om detta kan verka konstigt, liknar det en vanlig regel på engelska. De flesta singulariska substantiv görs plural genom att lägga till en "s" eller kanske "es" i slutet av ordet.
Vad all denna latinska grammatik betyder är att flertalet av datum är data. Så det är korrekt att tala om ett datum och flera data.
Även om vissa behandlar orddata som ett kollektivt substantiv som hänvisar till en insamling av information, känner de flesta som skriver i statistik ursprunget till ordet. En enda information är ett datum, mer än en är data. Som en följd av att data är ett pluralistiskt ord är det korrekt att tala och skriva om "dessa data" snarare än "dessa data." Liksom samma rader skulle vi säga att "data är ..." snarare än "data är ... "
Ett sätt att undvika denna fråga är att betrakta all data som en uppsättning. Då kan vi prata om en enkel uppsättning data.
En kort frågesport kan ytterligare hjälpa till att sortera rätt sätt att använda termen data. Nedan finns fem uttalanden. Bestäm vilka två som är felaktiga.
Uttalande nr 2 behandlar inte data som ett flertal, och det är därför felaktigt. Uttalande 4 behandlar felaktigt orduppsättningen som ett plural, medan det är singular. Resten av uttalandena är korrekta. Uttalande nr 5 är något knepigt eftersom orduppsättningen är en del av prepositionsfrasen "från uppsättningen."
Det finns inte många platser där ämnena grammatik och statistik korsar varandra, men detta är ett viktigt. Med lite övning blir det lätt att använda orddata och datum korrekt.