Carregar o conjunto de dados
O NannyML inclui alguns conjuntos de dados internos para facilitar a demonstração de casos de uso e o teste de diferentes algoritmos. Para carregar o conjunto de dados, basta usar a função nannyml.load_us_census_ma_employment_data().
A função retorna três objetos DataFrame do Pandas: o conjunto de referência (o conjunto de teste), o conjunto de análise (dados de produção não vistos) e a ground truth do conjunto de análise. Esses data frames devem ser nomeados seguindo a convenção: reference, analysis e analysis_gt.
Neste exercício, você vai carregar o conjunto de dados US Census Employment e imprimir os data frames para entender como eles são.
Este exercício faz parte do curso
Monitoramento de Machine Learning em Python
Instruções do exercício
- Importe a biblioteca
nannyml. - Carregue o conjunto de dados US Census Employment da biblioteca
nannyml. - Imprima o head dos dados de referência.
- Imprima o head dos dados de análise.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import nannyml
import ____
# Load US Census Employment dataset
____, ____, ____ = ____.____()
# Print head of the reference data
____
# Print head of the analysis data
____