ComenzarEmpieza gratis

Extrayendo el primer dígito I

Para abordar la posible existencia de fraude electoral, empieza creando una nueva columna que contenga el primer dígito del total de votos emitidos. Para ello, usarás una función personalizada que hemos creado para ti llamada get_first(). El núcleo de esta función es substr(), que toma una cadena de texto y extrae una parte llamada subcadena.

Una vez que crees una nueva variable que contenga solo el primer dígito, podrás ver qué tan bien sigue la ley de Benford construyendo un gráfico de barras.

Este ejercicio forma parte del curso

Inferencia para datos categóricos en R

Ver curso

Instrucciones del ejercicio

  • Echa un vistazo a cómo funciona get_first() escribiendo simplemente el nombre de la función (sin paréntesis). Lo único que hace es ajustar la salida de substr() para que sea un factor.
  • Crea (con mutate) una nueva columna en el data frame iran llamada first_digit que contenga el primer dígito del total de votos emitidos por ciudad.
  • Comprueba que get_first() funcionó. A partir de los datos de iran, selecciona las columnas total_votes_cast y first_digit y muéstralas en pantalla.
  • Construye un gráfico de barras para visualizar la distribución del primer dígito.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Print get_first
get_first

# Create first_digit variable
iran <- iran %>%
  ___
  
# Check if get_first worked
___ %>%
  ___

# Construct bar plot
___ +
  # Add bar layer
  ___
Editar y ejecutar código