Ispezionare i dati in un DataFrame PySpark
Ispezionare i dati è fondamentale prima di svolgere analisi come visualizzazioni, modellazione, training, ecc. In questo semplice esercizio, ispezionerai i dati nel DataFrame people_df che hai creato nell'esercizio precedente usando gli operatori di base dei DataFrame.
Ricorda: nella tua area di lavoro hai già a disposizione una SparkSession spark e un DataFrame people_df.
Questo esercizio fa parte del corso
Fondamenti di Big Data con PySpark
Istruzioni dell'esercizio
- Stampa le prime 10 osservazioni del DataFrame
people_df. - Conta il numero di righe del DataFrame
people_df. - Quante colonne ha il DataFrame
people_dfe quali sono i loro nomi?
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Print the first 10 observations
people_df.____(10)
# Count the number of rows
print("There are {} rows in the people_df DataFrame.".format(people_df.____()))
# Count the number of columns and print their names
print("There are {} columns in the people_df DataFrame and their names are {}".format(len(people_df.____), people_df.____))