No es miembro
Ahora que ha practicado la identificación de problemas de restricciones de pertenencia, es el momento de solucionarlos en un nuevo conjunto de datos. A lo largo de este capítulo, trabajará con un conjunto de datos llamado sfo_survey
, que contiene las respuestas a la encuesta de los pasajeros que toman vuelos desde el Aeropuerto Internacional de San Francisco (SFO). A los participantes se les hicieron preguntas sobre la limpieza del aeropuerto, los tiempos de espera, la seguridad y su satisfacción general.
Durante la recogida de datos se produjeron algunos problemas que dieron lugar a incoherencias en el conjunto de datos. En este ejercicio, trabajará con la columna dest_size
, que clasifica el tamaño del aeropuerto de destino al que volaban los pasajeros. Existe un marco de datos llamado dest_sizes
que contiene todos los tamaños de destino posibles. Tu misión es encontrar filas con dest_size
s inválidos y eliminarlas del marco de datos.
dplyr
se ha cargado y sfo_survey
y dest_sizes
están disponibles.
Este ejercicio forma parte del curso
Limpieza de datos en R
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Count the number of occurrences of dest_size
sfo_survey %>%
count(___)