Ajustar el número de intervalos en un histograma
El histograma que acabas de crear tenía diez intervalos. Este es el valor predeterminado de matplotlib. La «regla de la raíz cuadrada» es una pauta muy usada para elegir el número de intervalos: elige el número de intervalos como la raíz cuadrada del número de muestras. Vuelve a representar el histograma de las longitudes de pétalo de la Iris versicolor, esta vez usando la regla de la raíz cuadrada para el número de intervalos. Especificas el número de intervalos usando el argumento con palabra clave bins de plt.hist().
Las utilidades de visualización ya están importadas y los valores predeterminados de seaborn ya están configurados. La variable versicolor_petal_length contiene un array con las longitudes de pétalo y ya está en tu espacio de nombres.
Este ejercicio forma parte del curso
Pensamiento estadístico en Python (Parte 1)
Instrucciones del ejercicio
- Importa
numpycomonp. Esto da acceso a la función de raíz cuadrada,np.sqrt(). - Determina cuántos puntos de datos tienes usando
len(). - Calcula el número de intervalos usando la regla de la raíz cuadrada.
- Convierte el número de intervalos a un entero usando la función integrada
int(). - Genera el histograma y asegúrate de usar el argumento con palabra clave
bins. - Pulsa Enviar para trazar la figura y ver el fruto de tu trabajo.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Import numpy
# Compute number of data points: n_data
# Number of bins is the square root of number of data points: n_bins
# Convert number of bins to integer: n_bins
# Plot the histogram
# Label axes
_ = plt.xlabel('petal length (cm)')
_ = plt.ylabel('count')
# Show histogram
plt.show()