Les statistiques descriptives sont des analyses de données quantitatives qui résument les modèles et qui, par conséquent, évitent souvent aux lecteurs de parcourir de grandes quantités de données pour comprendre les résultats de la recherche.
Les mesures de la tendance centrale sont des exemples de statistiques de données descriptives qui décrivent une tendance « centrale » globale d’un ensemble de données. Il existe trois mesures clés :
Mode – le nombre le plus fréquent dans un ensemble de données.
par exemple, le mode de 1, 2, 3, 4, 4, 5 est 4
Médiane – le score moyen lorsque les données sont en ordre numérique.
par exemple, la médiane des chiffres 1, 2, 3, 4, 5 serait 3),
S’il y a un nombre pair de données, alors c’est la somme des deux chiffres du milieu, divisée par deux (par exemple, la médiane de 1, 2, 3, 4, serait / 2 = 2.5)
Moyenne – parfois appelée moyenne, provenant de la méthode pour la calculer : la somme de tous les nombres dans l’ensemble de données, divisée par le nombre de nombres dans l’ensemble de données.
par exemple, la moyenne de 1, 2, 3, 4, 5, 6 serait calculée :
/ 6 = 3.5
La moyenne prend en compte tous les chiffres d’un ensemble de données, ce qui pourrait être considéré comme un point fort de la mesure, mais cela signifie également qu’elle est susceptible de biaiser le chiffre final calculé si les données présentent des valeurs extrêmes.
Par exemple, dans un ensemble de données – 1, 2, 3, 4, 19 – la moyenne serait de 5,8
c’est-à-dire / 2)
ce qui pourrait être considéré comme non représentatif car la plupart des valeurs de l’ensemble de données sont inférieures à 5,8.
Dans cette perspective, la médiane (c’est-à-dire 3) pourrait être une meilleure statistique descriptive à rapporter, car elle donne une valeur qui n’est pas affectée par les valeurs extrêmes.
Le mode peut être utile en montrant la ou les valeurs les plus fréquentes dans un ensemble de données, mais il est peu utile lorsque l’ensemble de données comprend de nombreuses valeurs différentes de la même fréquence, c’est-à-dire qu’il y a plusieurs modes.
Par exemple, dans un ensemble de données -1, 2, 3, 4, 19 – les 5 valeurs sont le mode, ce qui ne résume pas du tout les données.