IniziaInizia gratis

Slicing delle serie temporali

Lo slicing è particolarmente utile per le serie temporali, perché spesso serve filtrare i dati in un intervallo di tempo specifico. Aggiungi la colonna date all'indice, poi usa .loc[] per creare il sottoinsieme. È importante usare le date nel formato ISO 8601, cioè "yyyy-mm-dd" per anno-mese-giorno, "yyyy-mm" per anno-mese e "yyyy" per anno.

Ricorda dal Capitolo 1 che puoi combinare più condizioni booleane usando operatori logici come &. Per farlo in un’unica riga di codice, devi racchiudere ogni condizione tra parentesi ().

pandas è già stato caricato come pd e temperatures, senza indice, è a tua disposizione.

Questo esercizio fa parte del corso

Manipolazione dei dati con pandas

Visualizza il corso

Istruzioni dell'esercizio

  • Usa le condizioni booleane (non .isin() o .loc[]) e la data completa "yyyy-mm-dd" per estrarre le righe di temperatures in cui la colonna date è nel 2010 o nel 2011, quindi stampa i risultati.
  • Imposta l'indice di temperatures sulla colonna date e ordinalo.
  • Usa .loc[] per estrarre da temperatures_ind le righe relative agli anni 2010 e 2011.
  • Usa .loc[] per creare un sottoinsieme di temperatures_ind per le righe da August 2010 a February 2011.

Esercizio pratico interattivo

Prova questo esercizio completando il codice di esempio.

# Use Boolean conditions to subset temperatures for rows in 2010 and 2011
temperatures_bool = ____[(____ >= ____) & (____ <= ____)]
print(temperatures_bool)

# Set date as the index and sort the index
temperatures_ind = temperatures.____.____

# Use .loc[] to subset temperatures_ind for rows in 2010 and 2011
print(____)

# Use .loc[] to subset temperatures_ind for rows from Aug 2010 to Feb 2011
print(____)
Modifica ed esegui il codice