ComenzarEmpieza gratis

Muestreo simple con dplyr

A lo largo de este capítulo, explorarás datos de canciones de Spotify. Cada fila del conjunto de datos representa una canción y hay 41656 filas. Las columnas incluyen el nombre de la canción, los artistas que la interpretan, el año de lanzamiento y atributos como su duración, tempo y "danceability". Empezaremos fijándonos en las duraciones.

Tu primera tarea es tomar una muestra del conjunto de datos de canciones y comparar un cálculo en toda la población con el mismo cálculo en una muestra.

spotify_population está disponible y dplyr está cargado.

Este ejercicio forma parte del curso

Muestreo en R

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# View the whole population dataset
___

# Sample 1000 rows from spotify_population
spotify_sample <- ___


# See the result
spotify_sample
Editar y ejecutar código