ComenzarEmpieza gratis

Gráfico mosaic

El gráfico de columnas apiladas (spine plot) que creaste en el ejercicio anterior te permite estudiar patrones de datos faltantes entre dos variables a la vez. Esta idea se generaliza a más variables con un gráfico mosaic.

En este ejercicio, empezarás creando una variable indicadora que señale si Estados Unidos participó en la producción de cada película. Para ello, usarás la función grepl(), que comprueba si la cadena pasada como primer argumento está presente en el objeto pasado como segundo argumento. Después, dibujarás un gráfico mosaic para ver si el género del sujeto se correlaciona con la cantidad de datos faltantes en los ingresos para películas de EE. UU. y de fuera de EE. UU.

Los datos biopics, así como el paquete VIM, ya están cargados. ¡Vamos a explorar con algunos gráficos!

Nota: se ha creado una función propietariadisplay_image()para devolver la salida de la última versión del paqueteVIM. Asegúrate de expandir la secciónHTML Viewer_.

Este ejercicio forma parte del curso

Tratamiento de datos faltantes con imputaciones en R

Ver curso

Instrucciones del ejercicio

  • Pasa los datos de biopics al pipeline de dplyr.
  • Crea una variable indicadora is_US_movie que sea TRUE si country contiene la cadena "US" y FALSE en caso contrario.
  • Dibuja un gráfico mosaic que muestre la cantidad de datos faltantes en "earnings" dividida por "is_US_movie" y "sub_sex", recordando pasar los nombres de las variables como cadenas.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Prepare data for plotting and draw a mosaic plot
___ %>%
	# Create a dummy variable for US-produced movies
	mutate(is_US_movie = grepl(___, ___)) %>%
	# Draw mosaic plot
	mosaicMiss(highlight = ___, 
             plotvars = c(___, ___))

# Return plot from latest VIM package - expand the HTML viewer section
display_image()
Editar y ejecutar código