1. Learn
  2. /
  3. Cursuri
  4. /
  5. Monitorizarea Machine Learning în Python

Connected

exercițiu

Verificări ale calității datelor

Așa cum ai învățat în videoclipul anterior, valorile lipsă pot duce la pierderea unor informații valoroase și pot genera interpretări incorecte. În mod similar, prezența valorilor nevăzute poate afecta și ea nivelul de încredere al modelului.

În acest exercițiu, scopul tău este să explorezi dacă setul de date pentru rezervările hoteliere conține valori lipsă și să identifici eventuale valori nevăzute. Seturile de date de referință și de analiză sunt deja încărcate, împreună cu biblioteca nannyml.

O scurtă reamintire: dacă nu îți amintești tipurile coloanelor, poți explora cu ușurință datele folosind metoda .head().

Instrucțiuni 1/2

undefined XP
  • 1
    • Inițializează calculatorul de valori lipsă, transmițând coloanele selectate la column_names și setând chunk_period la lunar.
  • 2
    • Adaugă două nume de coloane categorice, country și hotel, inițializează calculatorul de valori nevăzute și transmite categorical_columns la column_names.