Personalizar la importación de hojas de cálculo
Aquí, analizarás tus hojas de cálculo y utilizarás hojas adicionales de argumentos para omitir filas, renombrar columnas y seleccionar solo columnas concretas.
La hoja de cálculo 'battledeath.xlsx' ya está cargada como
xls.
Como antes, utilizarás el método parse(). Sin embargo, esta vez
añadirás los argumentos adicionales skiprows, names y
usecols. Estos omiten filas, nombran las columnas y designan
qué columnas analizar, respectivamente. Todos estos argumentos pueden
asignarse a listas que contengan los números de fila específicos, cadenas
y números de columna, según proceda.
Este ejercicio forma parte del curso
Introducción a la importación de datos en Python
Instrucciones del ejercicio
- Analiza la primera hoja por índice. Al hacerlo, omite la primera fila de datos y nombra las columnas
'Country'y'AAM due to War (2002)'utilizando el argumentonames. Los valores pasados askiprowsynamesdeben ser todos del tipolist. - Analiza la segunda hoja por índice. Al hacerlo, analiza solo la primera columna con el parámetro
usecols, omite la primera fila y cambia el nombre de la columna a'Country'. El argumento pasado ausecolstambién tiene que ser del tipolist.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Parse the first sheet and rename the columns: df1
df1 = xls.parse(____, skiprows=____, names=____)
# Print the head of the DataFrame df1
print(df1.head())
# Parse the first column of the second sheet and rename the column: df2
df2 = xls.parse(____, usecols=____, skiprows=____, names=____)
# Print the head of the DataFrame df2
print(df2.head())