¿Qué tan dispersos están mis datos?
La mayoría de los conjuntos de datos tienen valores ausentes, a menudo representados como NaN (Not a Number). Si trabajas con Pandas, puedes comprobar fácilmente cuántos valores faltan en cada columna.
Vamos a ver cuántos de los desarrolladores que respondieron a la encuesta decidieron indicar su edad (en la columna Age de so_survey_df) y su género (columna Gender de so_survey_df).
Este ejercicio forma parte del curso
Ingeniería de características para Machine Learning en Python
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Subset the DataFrame
sub_df = ____
# Print the number of non-missing values
print(sub_df.____)