Extraindo o primeiro dígito I
Para investigar a questão de fraude eleitoral, comece criando uma nova coluna com o primeiro dígito do total de votos. Para isso, você vai usar uma função personalizada que preparamos para você chamada get_first(). O núcleo dessa função é substr(), que recebe uma string e extrai um trecho chamado substring.
Depois de criar a nova variável contendo apenas o primeiro dígito, você pode avaliar o quão de perto ela segue a Lei de Benford construindo um gráfico de barras.
Este exercício faz parte do curso
Inferência para Dados Categóricos em R
Instruções do exercício
- Veja como
get_first()funciona apenas digitando o nome da função (sem parênteses). Ela apenas ajusta a saída desubstr()para que seja um fator. - Crie (mutate) uma nova coluna no data frame
iranchamadafirst_digitque contenha o primeiro dígito do total de votos por cidade. - Verifique se
get_first()funcionou. A partir dos dados deiran, selecione as colunastotal_votes_castefirst_digite imprima-as na tela. - Construa um gráfico de barras para visualizar a distribuição do primeiro dígito.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Print get_first
get_first
# Create first_digit variable
iran <- iran %>%
___
# Check if get_first worked
___ %>%
___
# Construct bar plot
___ +
# Add bar layer
___