IniziaInizia gratis

Applicare una UDF ai dati vettoriali

È disponibile un dataframe chiamato df con una colonna output di tipo vector. Le prime cinque righe sono mostrate nella console.

È disponibile una UDF get_first_udf che seleziona il primo elemento di una colonna vettoriale.

Questo esercizio fa parte del corso

Introduzione a Spark SQL in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Crea un nuovo dataframe chiamato df_new aggiungendo una nuova colonna a df. Chiama la nuova colonna label.
  • Mostra le prime cinque righe di df_new.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Add label by applying the get_first_udf to output column
df_new = df.____('____', ____('____'))

# Show the first five rows 
df_new.____
Modifica ed esegui il codice