Beskrivende statistik er analyser af kvantitative data, der opsummerer mønstre og derfor ofte sparer læsere for at gennemgå store mængder data for at forstå forskningsresultater.
Målinger af central tendens er eksempler på beskrivende datastatistik, der skildrer en overordnet “central” tendens i et sæt af data. Der findes tre centrale mål:
Mode – det hyppigst forekommende tal i et datasæt.
F.eks. er mode for 1, 2, 3, 4, 4, 4, 5 4
Median – den midterste score, når dataene er i numerisk orden.
f.eks. ville medianen af tallene 1, 2, 3, 4, 5 være 3),
Hvis der er et lige antal data, er dette summen af de to midterste tal, divideret med to (f.eks. ville medianen af tallene 1, 2, 3, 4, være / 2 = 2.5)
Middelværdi – kaldes nogle gange for gennemsnittet, hvilket stammer fra metoden til at beregne den: summen af alle tal i datasættet, divideret med hvor mange tal der er i datasættet.
f.eks. ville middelværdien af 1, 2, 3, 4, 5, 6 blive beregnet:
/ 6 = 3.5
Middelværdien tager hensyn til alle tal i et datasæt, hvilket kan betragtes som en styrke ved denne foranstaltning, men det betyder også, at den er modtagelig for skævhed i det endelige beregnede tal, hvis dataene indeholder ekstreme værdier.
For eksempel ville gennemsnittet i et datasæt – 1, 2, 3, 4, 19 – være 5,8
dvs. / 2)
hvilket kunne argumenteres som ikke-repræsentativt, da de fleste værdier i datasættet er mindre end 5,8.
Fra dette perspektiv kan medianen (dvs. 3) være en bedre beskrivende statistik at rapportere, da den giver en værdi, der ikke er påvirket af ekstreme værdier.
Moden kan være nyttig ved at vise de(n) hyppigste værdi(er) i et datasæt, men den er af ringe nytte, når datasættet indeholder mange forskellige værdier med samme hyppighed, dvs. der er mange modes.
For eksempel i et datasæt -1, 2, 3, 4, 4, 19 – alle 5 værdier er modus, hvilket slet ikke opsummerer dataene.