Définir des Expectations au niveau agrégé
C’est le moment de vous exercer à écrire des Expectations spécifiques à des colonnes au niveau agrégé. L’Expectation Suite et le Batch ont déjà été affectés aux variables suite et batch, respectivement, et chargés avec le jeu de données Shein Footwear. Great Expectations et pandas sont disponibles sous gx et pd, respectivement.
Cet exercice fait partie du cours
Introduction à la qualité des données avec Great Expectations
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# "colour" should be in the set "Khaki", "Purple", or "Grey"
colour_expectation = gx.expectations.ExpectColumnDistinctValuesToBeInSet(
____="colour", value_set={"Khaki", "Purple", "Grey"}
)
# "seller_name" should have 7 to 10 distinct values
seller_expectation = gx.expectations.ExpectColumnUniqueValueCountToBeBetween(
column="seller_name", ____=7, ____=10
)
# "link" should have all unique values
link_expectation = gx.expectations.____(
column="link"
)
# "review_count" should have a most common value in the set "0" or "100+"
review_count_expectation = gx.expectations.ExpectColumnMostCommonValueToBeInSet(
column=____, value_set=____
)