¿Los datos siguen nuestra historia?
Has modelado los no-hitters con una distribución Exponencial. Crea una ECDF con los datos reales. Superpón la CDF teórica con la ECDF de los datos. Esto te ayuda a verificar que la distribución Exponencial describe los datos observados.
Puede venirte bien recordar la función que creaste en el curso anterior para calcular la ECDF, así como el código que escribiste para representarla.
Este ejercicio forma parte del curso
Pensamiento estadístico en Python (Parte 2)
Instrucciones del ejercicio
- Calcula una ECDF a partir del tiempo real entre no-hitters (
nohitter_times). Usa la funciónecdf()que escribiste en el curso anterior. - Crea una CDF a partir de las muestras teóricas que tomaste en el último ejercicio (
inter_nohitter_time). - Dibuja
x_theoryy_theorcomo una línea usandoplt.plot(). Luego superpone la ECDF de los datos realesxyycomo puntos. Para hacerlo, debes especificar los argumentos con nombremarker = '.'ylinestyle = 'none'además dexyydentro deplt.plot(). - Establece un margen del 2% en la gráfica.
- Muestra la gráfica.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create an ECDF from real data: x, y
x, y = ____
# Create a CDF from theoretical samples: x_theor, y_theor
x_theor, y_theor = ____
# Overlay the plots
plt.plot(____, ____)
plt.plot(____, ____, marker=____, linestyle=____)
# Margins and axis labels
plt.margins(____)
plt.xlabel('Games between no-hitters')
plt.ylabel('CDF')
# Show the plot
plt.show()