Ulteriore pulizia dei dati: valori mancanti
Quando stampi la lunghezza del DataFrame intraday, noterai che mancano alcune righe. Ci saranno dati mancanti se non ci sono scambi in un determinato intervallo di un minuto. Un modo per vedere quali righe mancano è fare la differenza tra due insiemi: l’insieme completo di tutti i minuti e l’insieme dell’indice del DataFrame, che contiene le righe mancanti. Dopo aver inserito le righe mancanti, puoi convertire l’indice nell’ora del giorno e poi tracciare i dati.
Le azioni vengono scambiate a incrementi discreti di un centesimo (anche se una piccola percentuale di scambi avviene tra gli incrementi di un centesimo) e, quando tracci i dati, dovresti osservare lunghi periodi in cui il titolo rimbalza avanti e indietro all’interno di un intervallo di un centesimo. Questo fenomeno è talvolta chiamato "bid/ask bounce".
Questo esercizio fa parte del corso
Analisi delle serie temporali in Python
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Notice that some rows are missing
print("If there were no missing rows, there would be 391 rows of minute data")
print("The actual length of the DataFrame is:", len(___))