Aan de slagGa gratis aan de slag

Meer data opschonen: ontbrekende data

Als je de lengte van de DataFrame intraday afdrukt, zie je dat er een paar rijen ontbreken. Er ontbreekt data als er in een bepaald interval van één minuut geen transacties zijn. Een manier om te zien welke rijen ontbreken is het verschil te nemen van twee verzamelingen: de volledige set met elke minuut en de set van de DataFrame-index waarin rijen ontbreken. Nadat je de ontbrekende rijen hebt aangevuld, kun je de index omzetten naar tijd van de dag en vervolgens de data plotten.

Aandelen worden verhandeld in discrete stappen van één cent (al vindt een klein deel van de transacties plaats tussen die stappen) en niet tegen continue prijzen. Wanneer je de data plot, zou je moeten zien dat er lange perioden zijn waarin het aandeel heen en weer beweegt binnen een bereik van één cent. Dit wordt soms "bid/ask-bounce" genoemd.

Deze oefening maakt deel uit van de cursus

Tijdreeksanalyse in Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Notice that some rows are missing
print("If there were no missing rows, there would be 391 rows of minute data")
print("The actual length of the DataFrame is:", len(___))
Code bewerken en uitvoeren