IniziaInizia gratis

Ispezionare i dati in un DataFrame PySpark

Ispezionare i dati è fondamentale prima di svolgere analisi come visualizzazioni, modellazione, training, ecc. In questo semplice esercizio, ispezionerai i dati nel DataFrame people_df che hai creato nell'esercizio precedente usando gli operatori di base dei DataFrame.

Ricorda: nella tua area di lavoro hai già a disposizione una SparkSession spark e un DataFrame people_df.

Questo esercizio fa parte del corso

Fondamenti di Big Data con PySpark

Visualizza il corso

Istruzioni dell'esercizio

  • Stampa le prime 10 osservazioni del DataFrame people_df.
  • Conta il numero di righe del DataFrame people_df.
  • Quante colonne ha il DataFrame people_df e quali sono i loro nomi?

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Print the first 10 observations 
people_df.____(10)

# Count the number of rows 
print("There are {} rows in the people_df DataFrame.".format(people_df.____()))

# Count the number of columns and print their names
print("There are {} columns in the people_df DataFrame and their names are {}".format(len(people_df.____), people_df.____))
Modifica ed esegui il codice