Estadísticas descriptivas#

El término estadísticas descriptivas se refiere a métodos que permiten resumir colecciones de datos. Para demostrar los métodos más importantes, comenzamos definiendo primero un conjunto de datos.

measurements = [5, 2, 6, 4, 8, 6, 2, 5, 1, 3, 3, 6]

Medidas de tendencia central#

Podemos medir la ubicación de nuestras measurement en el espacio utilizando funciones estadísticas de numpy y el módulo de estadísticas de Python.

import numpy as np
import statistics as st
np.mean(measurements)
4.25
np.median(measurements)
4.5
st.mode(measurements)
6

Medidas de dispersión#

Numpy también permite medir la dispersión de measurements.

np.std(measurements)
2.0052015692526606
np.var(measurements)
4.020833333333333
np.min(measurements), np.max(measurements)
(1, 8)
np.percentile(measurements, [25, 50, 75])
array([2.75, 4.5 , 6.  ])

Ejercicio#

Averigua si la mediana de un conjunto de datos de muestra es siempre un número dentro de la muestra. Usa estos tres ejemplos para elaborar sobre esto:

example1 = [3, 4, 5]
example2 = [3, 4, 4, 5]
example3 = [3, 4, 5, 6]