¿Cuántos valores faltantes hay?
Una de las primeras cosas que querrás comprobar con un conjunto de datos nuevo es si hay valores faltantes y cuántos hay.
Podrías usar are_na() y contar los valores faltantes, pero la forma más eficiente de contarlos es con la función n_miss(). Esta te dirá el número total de valores faltantes en los datos.
Luego puedes calcular el porcentaje de valores faltantes con la función pct_miss. Esto te dirá el porcentaje de valores faltantes en los datos.
También puedes obtener el complemento de estos —cuántos valores completos hay— usando n_complete y pct_complete.
Este ejercicio forma parte del curso
Tratamiento de datos faltantes en R
Instrucciones del ejercicio
Usando el dataframe de ejemplo de alturas y pesos dat_hw:
- Usa
n_miss()sobre el dataframedat_hwpara contar el número total de valores faltantes del dataframe. - Usa
n_miss()sobre la variabledat_hw$weightpara contar el número total de valores faltantes de esa variable. - Del mismo modo, usa
prop_miss(),n_complete(), yprop_complete()para obtener la proporción de faltantes y el número y la proporción de valores completos tanto para el dataframe como para las variables.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Use n_miss() to count the total number of missing values in dat_hw
n_miss(___)
# Use n_miss() on dat_hw$weight to count the total number of missing values
n_miss(___$___)
# Use n_complete() on dat_hw to count the total number of complete values
n_complete(___)
# Use n_complete() on dat_hw$weight to count the total number of complete values
___(___$___)
# Use prop_miss() and prop_complete() on dat_hw to count the total number of missing values in each of the variables
prop_miss(____)
prop_complete(___)