Carica una parte di un foglio di calcolo

I fogli di calcolo pensati per la lettura da parte delle persone spesso contengono più tabelle; ad esempio, una piccola impresa potrebbe mantenere un workbook di inventario con tabelle per diversi tipi di prodotto su un unico foglio. Anche i dati tabellari possono avere righe di intestazione con metadati, come nel caso dei dati del New Developer Survey qui. Anche se i metadati sono utili, non li vogliamo in un dataframe. Userai il parametro skiprows di read_excel() per ottenere solo i dati. Inoltre, creerai una stringa da passare a usecols per ottenere solo la colonna AD e l'intervallo da AW a BA, relativo agli obiettivi professionali futuri.

pandas è già stato importato come pd.

Questo esercizio fa parte del corso

Acquisizione dati semplificata con pandas

Visualizza corso

Istruzioni dell'esercizio

Crea un'unica stringa, col_string, specificando che pandas deve caricare la colonna AD e l'intervallo da AW a BA.
Carica fcc_survey_headers.xlsx', impostando skiprows e usecols per saltare le prime due righe di metadati e ottenere solo le colonne in col_string.
Visualizza i nomi delle colonne selezionate nel dataframe risultante.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Create string of lettered columns to load
col_string = ____

# Load data with skiprows and usecols set
survey_responses = ____("fcc_survey_headers.xlsx", 
                        ____, 
                        ____)

# View the names of the columns selected
print(survey_responses.columns)

Modifica ed esegui il codice