Verkenning van features
Met dezelfde Avazu-gegevensset ga je verkennen hoe de waarden van device_type en banner_pos verdeeld zijn, en hoe de CTR op basis daarvan varieert.
Voorbeelddata in DataFrame-vorm is geladen als df. De variabelen X en y die je in de vorige oefening hebt gemaakt, zijn beschikbaar in je werkruimte. pandas als pd is ook beschikbaar in je werkruimte.
Deze oefening maakt deel uit van de cursus
CTR voorspellen met Machine Learning in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Distribution of values for device type
print("Distribution of device type: ")
print(X.device_type.____()/len(X))
# Sample CTR by device type
print("CTR by device type: ")
print(df.____('device_type')['click'].____/len(y))