Carregar uma parte de uma planilha
Planilhas feitas para leitura por pessoas costumam ter várias tabelas; por exemplo, uma pequena empresa pode manter uma pasta de trabalho de inventário com tabelas para diferentes tipos de produtos em uma única aba. Mesmo dados tabulares podem ter linhas de cabeçalho com metadados, como no conjunto New Developer Survey aqui. Embora os metadados sejam úteis, não queremos isso em um dataframe. Você vai usar o parâmetro skiprows de read_excel() para carregar apenas os dados. Você também vai criar uma string para passar para usecols a fim de obter somente a coluna AD e o intervalo de AW até BA, sobre objetivos de emprego futuros.
pandas já foi importado como pd.
Este exercício faz parte do curso
Ingestão de dados simplificada com pandas
Instruções do exercício
- Crie uma única string,
col_string, especificando que opandasdeve carregar a colunaADe também o intervalo deAWatéBA. - Carregue
fcc_survey_headers.xlsx', definindoskiprowseusecolspara ignorar as duas primeiras linhas de metadados e obter apenas as colunas emcol_string. - Veja os nomes das colunas selecionadas no dataframe resultante.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create string of lettered columns to load
col_string = ____
# Load data with skiprows and usecols set
survey_responses = ____("fcc_survey_headers.xlsx",
____,
____)
# View the names of the columns selected
print(survey_responses.columns)