1. Learn
  2. /
  3. Courses
  4. /
  5. Feature Engineering with PySpark

Connected

Exercise

Ověřování datových typů

V dnešní době máme přístup k více atributům než kdykoli předtím. Abychom si s nimi poradili, budeme hodně automatizovat – a základním předpokladem je, aby měly správné datové typy. V tomto cvičení ověříš slovník atributů a jejich datových typů a zjistíš, jestli jsou správné. Slovník je uložený v proměnné validation_dict a máš ho k dispozici ve svém pracovním prostředí.

Instructions

100 XP
  • Pomocí df vytvoř seznam n-tic obsahujících atribut a datový typ – použij dtypes a výsledek ulož do actual_dtypes_list.
  • Projdi actual_dtypes_list a zkontroluj, jestli názvy sloupců existují ve slovníku očekávaných datových typů validation_dict.
  • Pro klíče, které ve slovníku existují, porovnej jejich datové typy a vypiš ty, které se shodují.