IniziaInizia gratis

Genera uno scatter plot con valori mancanti

In questo esercizio creerai uno scatter plot che include sia valori mancanti sia non mancanti. Userai la funzione fill_dummy_values(), che hai creato nell’esercizio precedente, per riempire valori fittizi nel DataFrame diabetes_dummy.

La nullità di una colonna si calcola con il metodo .isnull(). La nullità restituisce una Series (pd.Series) di True o False.

Per assegnare colori diversi ai valori mancanti e non mancanti, puoi semplicemente combinare le nullità usando l’operatore OR (|) sulle colonne che stai tracciando, ottenendo:

  • True \(\rightarrow\) col1 o col2 (o entrambe) hanno valori mancanti.
  • False \(\rightarrow\) Né col1col2 hanno valori mancanti.

Il DataFrame diabetes e la funzione fill_dummy_values() sono già stati caricati e pronti all’uso.

Questo esercizio fa parte del corso

Gestire i dati mancanti in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Usa l’operatore OR per combinare la nullità di Skin_Fold e BMI.
  • Riempi i valori fittizi in diabetes_dummy usando la funzione fill_dummy_values().
  • Crea uno scatter plot di 'BMI' rispetto a 'Skin_Fold'; nota che Y rispetto a X implica asse Y contro asse X, ovvero Y come funzione di X.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Use OR operation to combine Skin_Fold and BMI nullity
nullity = ___

# Fill dummy values in diabetes_dummy
diabetes_dummy = ___

# Create a scatter plot of BMI versus Skin_Fold
diabetes_dummy.plot(x=___, y=___, kind='___', alpha=0.5,                     
                    # Set color to nullity of BMI and Skin_Fold
                    c=___, 
                    cmap='rainbow')

plt.show()
Modifica ed esegui il codice