Statistiques descriptives#
Le terme statistiques descriptives fait référence aux méthodes qui permettent de résumer des collections de données. Pour démontrer les méthodes les plus importantes, nous commençons par définir d’abord un ensemble de données.
measurements = [5, 2, 6, 4, 8, 6, 2, 5, 1, 3, 3, 6]
Mesures de tendance centrale#
Nous pouvons mesurer la position de nos measurement dans l’espace en utilisant les fonctions statistiques de numpy et le module statistics de Python.
import numpy as np
import statistics as st
np.mean(measurements)
4.25
np.median(measurements)
4.5
st.mode(measurements)
6
Mesures de dispersion#
Numpy permet également de mesurer la dispersion des measurements.
np.std(measurements)
2.0052015692526606
np.var(measurements)
4.020833333333333
np.min(measurements), np.max(measurements)
(1, 8)
np.percentile(measurements, [25, 50, 75])
array([2.75, 4.5 , 6. ])
Exercice#
Déterminez si la médiane d’un ensemble de données échantillonnées est toujours un nombre présent dans l’échantillon. Utilisez ces trois exemples pour élaborer votre réponse :
example1 = [3, 4, 5]
example2 = [3, 4, 4, 5]
example3 = [3, 4, 5, 6]