Slicing delle serie temporali
Lo slicing è particolarmente utile per le serie temporali, perché spesso serve filtrare i dati in un intervallo di tempo specifico. Aggiungi la colonna date all'indice, poi usa .loc[] per creare il sottoinsieme. È importante usare le date nel formato ISO 8601, cioè "yyyy-mm-dd" per anno-mese-giorno, "yyyy-mm" per anno-mese e "yyyy" per anno.
Ricorda dal Capitolo 1 che puoi combinare più condizioni booleane usando operatori logici come &. Per farlo in un’unica riga di codice, devi racchiudere ogni condizione tra parentesi ().
pandas è già stato caricato come pd e temperatures, senza indice, è a tua disposizione.
Questo esercizio fa parte del corso
Manipolazione dei dati con pandas
Istruzioni dell'esercizio
- Usa le condizioni booleane (non
.isin()o.loc[]) e la data completa"yyyy-mm-dd"per estrarre le righe ditemperaturesin cui la colonnadateè nel 2010 o nel 2011, quindi stampa i risultati. - Imposta l'indice di
temperaturessulla colonnadatee ordinalo. - Usa
.loc[]per estrarre datemperatures_indle righe relative agli anni 2010 e 2011. - Usa
.loc[]per creare un sottoinsieme ditemperatures_indper le righe da August 2010 a February 2011.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Use Boolean conditions to subset temperatures for rows in 2010 and 2011
temperatures_bool = ____[(____ >= ____) & (____ <= ____)]
print(temperatures_bool)
# Set date as the index and sort the index
temperatures_ind = temperatures.____.____
# Use .loc[] to subset temperatures_ind for rows in 2010 and 2011
print(____)
# Use .loc[] to subset temperatures_ind for rows from Aug 2010 to Feb 2011
print(____)