1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do PySpark

Connected

ćwiczenie

Operacje na kolumnach – tworzenie i zmiana nazw

Zbiór danych census nadal nie wyświetla wszystkiego, czego potrzebujesz. Dodaj nową, syntetyczną kolumnę na podstawie istniejących danych, a następnie zmień jej nazwę dla większej przejrzystości.

Pamiętaj, że w twoim środowisku pracy dostępna jest już sesja SparkSession o nazwie spark!

Instrukcje

100 XP
  • Utwórz nową kolumnę "weekly_salary", dzieląc kolumnę "income" przez 52.
  • Zmień nazwę kolumny "age" na "years".
  • Wyświetl wynikowy DataFrame.