Genera uno scatter plot con valori mancanti
In questo esercizio creerai uno scatter plot che include sia valori mancanti sia non mancanti. Userai la funzione fill_dummy_values(), che hai creato nell’esercizio precedente, per riempire valori fittizi nel DataFrame diabetes_dummy.
La nullità di una colonna si calcola con il metodo .isnull(). La nullità restituisce una Series (pd.Series) di True o False.
Per assegnare colori diversi ai valori mancanti e non mancanti, puoi semplicemente combinare le nullità usando l’operatore OR (|) sulle colonne che stai tracciando, ottenendo:
True\(\rightarrow\)col1ocol2(o entrambe) hanno valori mancanti.False\(\rightarrow\) Nécol1nécol2hanno valori mancanti.
Il DataFrame diabetes e la funzione fill_dummy_values() sono già stati caricati e pronti all’uso.
Questo esercizio fa parte del corso
Gestire i dati mancanti in Python
Istruzioni dell'esercizio
- Usa l’operatore OR per combinare la nullità di
Skin_FoldeBMI. - Riempi i valori fittizi in
diabetes_dummyusando la funzionefill_dummy_values(). - Crea uno scatter plot di
'BMI'rispetto a'Skin_Fold'; nota che Y rispetto a X implica asse Y contro asse X, ovvero Y come funzione di X.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Use OR operation to combine Skin_Fold and BMI nullity
nullity = ___
# Fill dummy values in diabetes_dummy
diabetes_dummy = ___
# Create a scatter plot of BMI versus Skin_Fold
diabetes_dummy.plot(x=___, y=___, kind='___', alpha=0.5,
# Set color to nullity of BMI and Skin_Fold
c=___,
cmap='rainbow')
plt.show()