Definisci Expectations a livello aggregato
È il momento di esercitarti a scrivere alcune Expectations specifiche per colonna a livello aggregato. L'Expectation Suite e il Batch sono già stati assegnati rispettivamente alle variabili suite e batch, e caricati con il dataset Shein Footwear. Great Expectations e pandas sono disponibili rispettivamente come gx e pd.
Questo esercizio fa parte del corso
Introduzione alla Data Quality con Great Expectations
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# "colour" should be in the set "Khaki", "Purple", or "Grey"
colour_expectation = gx.expectations.ExpectColumnDistinctValuesToBeInSet(
____="colour", value_set={"Khaki", "Purple", "Grey"}
)
# "seller_name" should have 7 to 10 distinct values
seller_expectation = gx.expectations.ExpectColumnUniqueValueCountToBeBetween(
column="seller_name", ____=7, ____=10
)
# "link" should have all unique values
link_expectation = gx.expectations.____(
column="link"
)
# "review_count" should have a most common value in the set "0" or "100+"
review_count_expectation = gx.expectations.ExpectColumnMostCommonValueToBeInSet(
column=____, value_set=____
)