1. 学ぶ
  2. /
  3. コース
  4. /
  5. Wprowadzenie do jakości danych z Great Expectations

Connected

演習

Tworzenie Expectations dla ciągów znaków

W tym ćwiczeniu przećwiczysz tworzenie i walidację Expectations dla wartości tekstowych, w tym Expectations dotyczących możliwości parsowania. Podobnie jak w poprzednim ćwiczeniu, zastanów się krytycznie nad tworzonymi Expectations i oceń, czy są odpowiednie dla tych danych.

Batch połączony ze zbiorem danych Shein Footwear został już utworzony i przypisany do zmiennej batch. Great Expectations i pandas są dostępne odpowiednio jako gx i pd.

指示1 / 4

undefined XP
  • 1
    • Wyświetl kilka pierwszych wierszy DataFrame, aby przypomnieć sobie strukturę danych.
  • 2
    • Utwórz Expectation zakładające, że każda wartość w kolumnie "name" ma długość 100 znaków.
    • Przeprowadź walidację swojego Expectation.
  • 3
    • Utwórz Expectation zakładające, że każda wartość w kolumnie "name" pasuje do podanego wzorca RegEx.
    • Przeprowadź walidację swojego Expectation.
  • 4
    • Utwórz Expectation zakładające, że wartości w kolumnie "name" można sparsować za pomocą dateutil.
    • Przeprowadź walidację swojego Expectation.