¿Cómo son tus datos? (I)
Hasta ahora te has centrado en crear nuevas variables y en resolver problemas en tus datos. La ingeniería de características también sirve para sacar más partido a los datos que ya tienes y usarlos con mayor eficacia al crear modelos de Machine Learning.
Muchos algoritmos asumen que tus datos siguen una distribución normal, o al menos que todas las columnas están en la misma escala. A menudo no será así; por ejemplo, una variable puede medirse en miles de dólares mientras que otra es un número de años. En este ejercicio, crearás gráficos para examinar las distribuciones de algunas columnas numéricas del DataFrame so_survey_df, almacenadas en so_numeric_df.
Este ejercicio forma parte del curso
Ingeniería de características para Machine Learning en Python
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create a histogram
____
plt.show()