1. Nauka
  2. /
  3. Kursy
  4. /
  5. Inżynieria cech w R

Connected

ćwiczenie

W głąb macierzy

Zidentyfikowano sześć odrębnych wartości dla EducationField. Podejrzewasz jednak, że podczas uruchamiania modelu na nowych danych mogą pojawić się kolejne. Aby się na to przygotować, stworzysz indeks haszujący z 50 termami. Pakiet textrecipes oraz podziały attrition_train i attrition_test są już załadowane.

Instrukcje

100 XP
  • Dodaj krok do przepisu, który generuje indeks dummy_hash dla EducationField.
  • Przygotuj przepis.
  • Zastosuj przygotowany przepis funkcją bake.
  • Połącz tabelę uzyskaną po zastosowaniu przepisu z wartościami EducationField w jedną tabelę i wyświetl pierwsze 7 wierszy oraz kolumny 1 i 18–20.