1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Feature Engineering with PySpark

Connected

cvičení

Škálování ve velkém

V předchozím cvičení jsme minmax škálovali jednu proměnnou. Co ale dělat, když máš proměnných hodně a nechceš psát stovky řádků kódu pro každou zvlášť? Rozšíříme předchozí řešení a zabalíme ho do funkce.

Pokyny

100 XP
  • Definuj funkci min_max_scaler, která přijímá parametry df (dataframe) a cols_to_scale (seznam sloupců ke škálování).
  • Pomocí smyčky for iteruj přes každý sloupec v seznamu a aplikuj na něj minmax škálování.
  • Vrať dataframe df s nově přidanými sloupci.
  • Zavolej funkci min_max_scaler() na df a seznam sloupců cols_to_scale.