Slicing delle serie temporali
Lo slicing è particolarmente utile per le serie temporali, perché spesso serve filtrare i dati in un intervallo di tempo specifico. Aggiungi la colonna date
all'indice, poi usa .loc[]
per creare il sottoinsieme. È importante usare le date nel formato ISO 8601, cioè "yyyy-mm-dd"
per anno-mese-giorno, "yyyy-mm"
per anno-mese e "yyyy"
per anno.
Ricorda dal Capitolo 1 che puoi combinare più condizioni booleane usando operatori logici come &
. Per farlo in un’unica riga di codice, devi racchiudere ogni condizione tra parentesi ()
.
pandas
è già stato caricato come pd
e temperatures
, senza indice, è a tua disposizione.
Questo esercizio fa parte del corso
Manipolazione dei dati con pandas
Istruzioni dell'esercizio
- Usa le condizioni booleane (non
.isin()
o.loc[]
) e la data completa"yyyy-mm-dd"
per estrarre le righe ditemperatures
in cui la colonnadate
è nel 2010 o nel 2011, quindi stampa i risultati. - Imposta l'indice di
temperatures
sulla colonnadate
e ordinalo. - Usa
.loc[]
per estrarre datemperatures_ind
le righe relative agli anni 2010 e 2011. - Usa
.loc[]
per creare un sottoinsieme ditemperatures_ind
per le righe da August 2010 a February 2011.
Esercizio pratico interattivo
Prova questo esercizio completando il codice di esempio.
# Use Boolean conditions to subset temperatures for rows in 2010 and 2011
temperatures_bool = ____[(____ >= ____) & (____ <= ____)]
print(temperatures_bool)
# Set date as the index and sort the index
temperatures_ind = temperatures.____.____
# Use .loc[] to subset temperatures_ind for rows in 2010 and 2011
print(____)
# Use .loc[] to subset temperatures_ind for rows from Aug 2010 to Feb 2011
print(____)