Descriptieve statistieken zijn analyses van kwantitatieve gegevens die patronen samenvatten, en daardoor lezers vaak behoeden voor het doorspitten van grote hoeveelheden gegevens om onderzoeksbevindingen te begrijpen.
Maatstaven van centrale tendens zijn voorbeelden van beschrijvende gegevensstatistieken die een algemene ‘centrale’ tendens van een gegevensreeks weergeven. Er zijn drie belangrijke maatstaven:
Modus – het meest voorkomende getal in een gegevensverzameling.
b.v. de modus van 1, 2, 3, 4, 4, 5 is 4
Middelpunt – de middelste score wanneer de gegevens in numerieke volgorde staan.
bv. de mediaan van de getallen 1, 2, 3, 4, 5 zou 3 zijn),
Als er een even aantal gegevens is, dan is dit de som van de twee middelste getallen, gedeeld door twee (b.v. de mediaan van 1, 2, 3, 4, zou zijn / 2 = 2.5)
Gemiddelde – soms ook gemiddelde genoemd, vanwege de methode om het te berekenen: de som van alle getallen in de gegevensverzameling, gedeeld door het aantal getallen in de gegevensverzameling.
Bijv. het gemiddelde van 1, 2, 3, 4, 5, 6 zou worden berekend:
/ 6 = 3.5
Het gemiddelde neemt alle getallen van een gegevensverzameling in aanmerking, wat als een sterk punt van de maatstaf kan worden beschouwd, maar dit betekent ook dat het vatbaar is voor scheefheid van het uiteindelijk berekende getal als de gegevens extreme waarden bevatten.
Bijv. in een gegevensverzameling – 1, 2, 3, 4, 19 – zou het gemiddelde 5,8 zijn
, d.w.z. / 2)
, wat als niet-representatief zou kunnen worden betoogd, aangezien de meeste waarden in de gegevensverzameling kleiner zijn dan 5,8.
Vanuit dit oogpunt is de mediaan (d.w.z. 3) wellicht een betere beschrijvende statistiek om te rapporteren, omdat deze een waarde oplevert die niet wordt beïnvloed door extreme waarden.
De modus kan nuttig zijn door de meest frequente waarde(n) in een gegevensverzameling weer te geven, maar is van weinig nut wanneer de gegevensverzameling veel verschillende waarden met dezelfde frequentie omvat, d.w.z. er zijn veel modi.
Bijv. in een gegevensverzameling -1, 2, 3, 4, 19 – alle 5 waarden zijn de modus, hetgeen de gegevens helemaal niet samenvat.