Indicizzazione booleana per statistiche rapide
Torniamo al dataset animals, caricato come lista di dizionari. Userai tutto ciò che hai imparato per trasformare questi dati in un DataFrame utilizzabile, filtrare i dati con l’indicizzazione booleana e poi fare un po’ di magia con numpy per scoprire alcune curiosità sugli animali.
Questo esercizio fa parte del corso
Python per utenti MATLAB
Istruzioni dell'esercizio
- Crea un DataFrame
animalsa partire dalla lista di dizionarianimals. - Crea un indice booleano
mammalstrovando i record in cui "Class" è "Mammalia". - Crea un indice booleano
birdstrovando i record in cui "Class" è "Aves". - Usa
numpyper calcolare la media della colonna "Litter/Clutch size" per mammiferi e uccelli.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create a DataFrame from animals
animals = pd.____(animals)
# Create Boolean indices for mammals and birds
mammals = animals['Class']=='____'
birds = animals['Class']=='____'
# Use numpy and the Boolean indices to determine mean Litter/Clutch size
litter = np.____(animals[mammals]['Litter/Clutch size'])
clutch = np.____(animals[____]['Litter/Clutch size'])
# Print the average Litter/Clutch size of each class
print('Mammals have an average of {} offspring in each litter.'.format(round(litter, 2)))
print('The average clutch size in a single brood is {} eggs.'.format(round(clutch, 2)))