ComenzarEmpieza gratis

Utilizar pandas para importar archivos planos como DataFrames (2)

En el último ejercicio, pudiste importar ficheros planos en un DataFrame pandas. Además, es muy sencillo para recuperar la correspondiente matriz numpy mediante el método .to_numpy(). Ahora tendrás la oportunidad Para ello, utiliza el conjunto de datos MNIST, disponible en digits.csv.

Hay una serie de argumentos que pd.read_csv() toma y que te resultarán útiles para este ejercicio:

  • nrows te permite especificar cuántas filas leer del archivo. Por ejemplo, nrows=10 solo importará las primeras 10 filas.
  • header Acepta números de fila para utilizarlos como etiquetas de columna y marca el inicio de los datos. Si el archivo no contiene una fila de encabezado, puedes establecer header=None y pandas asignará automáticamente etiquetas de columna enteras comenzando por 0 (por ejemplo, 0, 1, 2, …).

Este ejercicio forma parte del curso

Introducción a la importación de datos en Python

Ver curso

Instrucciones del ejercicio

  • Importa las 5 primeras filas del archivo a un DataFrame utilizando la función ** y asigna el resultado a pd.read_csv(). Tendrás que utilizar los argumentos nrows y header. Ten en cuenta que este archivo no tiene fila de encabezado.
  • Construye un array numpy a partir del DataFrame resultante en data y asígnalo a data_array.
  • Ejecuta print(type(data_array)) para imprimir el tipo de dato de data_array.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Assign the filename: file
file = 'digits.csv'

# Read the first 5 rows of the file into a DataFrame: data
data = ____(____, ____, ____)

# Build a numpy array from the DataFrame: data_array
data_array = ____

# Print the datatype of data_array to the shell
print(type(data_array))
Editar y ejecutar código