Personalizar la importación de hojas de cálculo
Aquí, analizarás tus hojas de cálculo y utilizarás hojas adicionales de argumentos para omitir filas, renombrar columnas y seleccionar sólo columnas concretas.
La hoja de cálculo 'battledeath.xlsx'
ya está cargada como
xls
.
Como antes, utilizarás el método parse()
. Sin embargo, esta vez
añadirás los argumentos adicionales skiprows
, names
y
usecols
. Estos omiten filas, nombran las columnas y designan
qué columnas analizar, respectivamente. Todos estos argumentos pueden
asignarse a listas que contengan los números de fila específicos, cadenas
y números de columna, según proceda.
Este ejercicio forma parte del curso
Introducción a la importación de datos en Python
Instrucciones del ejercicio
- Analiza la primera hoja por índice. Al hacerlo, omite la primera fila de datos y nombra las columnas
'Country'
y'AAM due to War (2002)'
utilizando el argumentonames
. Los valores pasados askiprows
ynames
deben ser todos del tipolist
. - Analiza la segunda hoja por índice. Al hacerlo, analiza sólo la primera columna con el parámetro
usecols
, omite la primera fila y cambia el nombre de la columna a'Country'
. El argumento pasado ausecols
también tiene que ser del tipolist
.
Ejercicio interactivo práctico
Prueba este ejercicio completando el código de muestra.
# Parse the first sheet and rename the columns: df1
df1 = xls.parse(____, skiprows=____, names=____)
# Print the head of the DataFrame df1
print(df1.head())
# Parse the first column of the second sheet and rename the column: df2
df2 = xls.parse(____, usecols=____, skiprows=____, names=____)
# Print the head of the DataFrame df2
print(df2.head())