Personalização da importação de planilhas
Aqui, você analisará suas planilhas e usará argumentos para ignorar linhas, renomear colunas e selecionar apenas colunas específicas.
A planilha 'battledeath.xlsx'
já está carregada como
xls
.
Como antes, você usará o método parse()
. Desta vez, porém,
você adicionará os argumentos adicionais skiprows
, names
e
usecols
. Esses pularam linhas, nomearam as colunas e designaram
quais colunas devem ser analisadas, respectivamente. Todos esses argumentos podem
ser atribuídos a listas contendo os números de linha específicos, cadeias de caracteres
e números de coluna, conforme apropriado.
Este exercício faz parte do curso
Introdução à importação de dados em Python
Instruções de exercício
- Analisar a primeira planilha por índice. Ao fazer isso, ignore a primeira linha de dados e nomeie as colunas
'Country'
e'AAM due to War (2002)'
usando o argumentonames
. Os valores passados paraskiprows
enames
precisam ser todos do tipolist
. - Analisar a segunda planilha por índice. Ao fazer isso, analise apenas a primeira coluna com o parâmetro
usecols
, ignore a primeira linha e renomeie a coluna como'Country'
. O argumento passado parausecols
também precisa ser do tipolist
.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Parse the first sheet and rename the columns: df1
df1 = xls.parse(____, skiprows=____, names=____)
# Print the head of the DataFrame df1
print(df1.head())
# Parse the first column of the second sheet and rename the column: df2
df2 = xls.parse(____, usecols=____, skiprows=____, names=____)
# Print the head of the DataFrame df2
print(df2.head())