ComeçarComece de graça

Gráfico mosaico

O gráfico de espinha que você criou no exercício anterior permite estudar padrões de dados ausentes entre duas variáveis por vez. Essa ideia é generalizada para mais variáveis na forma de um gráfico mosaico.

Neste exercício, você vai começar criando uma variável dummy indicando se os Estados Unidos participaram da produção de cada filme. Para isso, você usará a função grepl(), que verifica se a string passada como primeiro argumento está presente no objeto passado como segundo argumento. Em seguida, você vai desenhar um gráfico mosaico para ver se o gênero do sujeito se correlaciona com a quantidade de dados ausentes em receitas, tanto para filmes dos EUA quanto para filmes de fora dos EUA.

Os dados biopics, assim como o pacote VIM, já estão carregados para você. Vamos fazer alguns gráficos exploratórios!

Observação: uma função proprietáriadisplay_image()foi criada para retornar a saída da versão mais recente do pacoteVIM. Certifique-se de expandir a seçãoHTML Viewer_.

Este exercício faz parte do curso

Tratamento de Dados Ausentes com Imputações em R

Ver curso

Instruções do exercício

  • Envie os dados biopics para o pipeline do dplyr.
  • Crie uma variável dummy is_US_movie que seja TRUE se country contiver a string "US" e FALSE caso contrário.
  • Desenhe um gráfico mosaico que mostre a quantidade de dados ausentes em "earnings" dividida por "is_US_movie" e "sub_sex", lembrando-se de passar os nomes das variáveis como strings.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Prepare data for plotting and draw a mosaic plot
___ %>%
	# Create a dummy variable for US-produced movies
	mutate(is_US_movie = grepl(___, ___)) %>%
	# Draw mosaic plot
	mosaicMiss(highlight = ___, 
             plotvars = c(___, ___))

# Return plot from latest VIM package - expand the HTML viewer section
display_image()
Editar e executar o código