Carica una parte di un foglio di calcolo
I fogli di calcolo pensati per la lettura da parte delle persone spesso contengono più tabelle; ad esempio, una piccola impresa potrebbe mantenere un workbook di inventario con tabelle per diversi tipi di prodotto su un unico foglio. Anche i dati tabellari possono avere righe di intestazione con metadati, come nel caso dei dati del New Developer Survey qui. Anche se i metadati sono utili, non li vogliamo in un dataframe. Userai il parametro skiprows di read_excel() per ottenere solo i dati. Inoltre, creerai una stringa da passare a usecols per ottenere solo la colonna AD e l'intervallo da AW a BA, relativo agli obiettivi professionali futuri.
pandas è già stato importato come pd.
Questo esercizio fa parte del corso
Acquisizione dati semplificata con pandas
Istruzioni dell'esercizio
- Crea un'unica stringa,
col_string, specificando chepandasdeve caricare la colonnaADe l'intervallo daAWaBA. - Carica
fcc_survey_headers.xlsx', impostandoskiprowseusecolsper saltare le prime due righe di metadati e ottenere solo le colonne incol_string. - Visualizza i nomi delle colonne selezionate nel dataframe risultante.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create string of lettered columns to load
col_string = ____
# Load data with skiprows and usecols set
survey_responses = ____("fcc_survey_headers.xlsx",
____,
____)
# View the names of the columns selected
print(survey_responses.columns)