Extrayendo el primer dígito I
Para abordar la posible existencia de fraude electoral, empieza creando una nueva columna que contenga el primer dígito del total de votos emitidos. Para ello, usarás una función personalizada que hemos creado para ti llamada get_first(). El núcleo de esta función es substr(), que toma una cadena de texto y extrae una parte llamada subcadena.
Una vez que crees una nueva variable que contenga solo el primer dígito, podrás ver qué tan bien sigue la ley de Benford construyendo un gráfico de barras.
Este ejercicio forma parte del curso
Inferencia para datos categóricos en R
Instrucciones del ejercicio
- Echa un vistazo a cómo funciona
get_first()escribiendo simplemente el nombre de la función (sin paréntesis). Lo único que hace es ajustar la salida desubstr()para que sea un factor. - Crea (con
mutate) una nueva columna en el data frameiranllamadafirst_digitque contenga el primer dígito del total de votos emitidos por ciudad. - Comprueba que
get_first()funcionó. A partir de los datos deiran, selecciona las columnastotal_votes_castyfirst_digity muéstralas en pantalla. - Construye un gráfico de barras para visualizar la distribución del primer dígito.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Print get_first
get_first
# Create first_digit variable
iran <- iran %>%
___
# Check if get_first worked
___ %>%
___
# Construct bar plot
___ +
# Add bar layer
___