ComenzarEmpieza gratis

Operaciones con columnas: crear y renombrar columnas

El conjunto de datos census todavía no muestra exactamente todo lo que quieres. Vamos a crear una columna sintética añadiendo una columna nueva basada en columnas existentes y a renombrarla para que sea más clara.

Recuerda: ¡ya tienes una SparkSession llamada spark en tu espacio de trabajo!

Este ejercicio forma parte del curso

Introducción a PySpark

Ver curso

Instrucciones del ejercicio

  • Crea una nueva columna, "weekly_salary", dividiendo la columna "income" entre 52.
  • Cambia el nombre de la columna "age" a "years".
  • Muestra el DataFrame resultante.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Create a new column 'weekly_salary'
census_df_weekly = census_df.____(____, ____)

# Rename the 'age' column to 'years'
census_df_weekly = ____.____(____, ____)

# Show the result
census_df_weekly.____
Editar y ejecutar código