Aan de slagBegin gratis

Een dummy voor ontbrekende waarden maken

Gegeven een basetable met een voorspellende variabele "total_donations" die het totale aantal donaties bevat dat een donateur ooit heeft gedaan. Deze variabele kan ontbrekende waarden bevatten, wat aangeeft dat deze donateur nog nooit eerder heeft gedoneerd. Dat is op zichzelf belangrijke informatie, dus het is passend om een variabele "no_donations" te maken die aangeeft of "total_donations" ontbreekt.

Deze oefening maakt deel uit van de cursus

Gevorderde voorspellende analyse in Python

Bekijk cursus

Oefeninstructies

  • Maak een nieuwe kolom "no_donations" in basetable die de waarde 1 heeft als total_donations ontbreekt en anders 0.
  • Bereken het aantal ontbrekende waarden in total_donations en ken dit toe aan number_na.
  • Print het percentage ontbrekende waarden.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Create dummy indicating missing values
basetable["____"] = pd.Series([____ if b else ____ for b in basetable["total_donations"].isna()])

# Calculate number of missing values
number_na = sum(____["no_donations"] == ____)

# Calculate percentage of missing values
print(round(____ / ____(____), 2))
Code bewerken en uitvoeren