Gerar valores fictícios
Assim como você tentou encontrar alguma relação de ausentes com ausentes entre colunas, também é importante buscar relações de ausentes com não ausentes entre colunas. Isso vai ajudar você a identificar fatores de ausência nos dados.
Na figura acima, você pode observar que os valores ausentes de Serum Insulin estão espalhados por toda a faixa de valores de BMI. Isso indica que não há relação!
Neste exercício, você vai escrever uma função para gerar valores fictícios para ajudar a criar o diagrama de dispersão acima (no próximo exercício). As operações para gerar valores fictícios envolvem dimensionar valores aleatórios para a faixa da coluna com um fator de escala e deslocar os valores.
A função rand() já foi importada para você a partir de numpy.random.
Este exercício faz parte do curso
Lidando com Dados Ausentes em Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
def fill_dummy_values(df):
df_dummy = df.copy(deep=True)
for col_name in df_dummy:
col = df_dummy[col_name]
# Calculate column range
col_range = ___ - ___
return df_dummy