ComeçarComece de graça

Gerar valores fictícios

Assim como você tentou encontrar alguma relação de ausentes com ausentes entre colunas, também é importante buscar relações de ausentes com não ausentes entre colunas. Isso vai ajudar você a identificar fatores de ausência nos dados.

BMI vs Serum Insulin

Na figura acima, você pode observar que os valores ausentes de Serum Insulin estão espalhados por toda a faixa de valores de BMI. Isso indica que não há relação!

Neste exercício, você vai escrever uma função para gerar valores fictícios para ajudar a criar o diagrama de dispersão acima (no próximo exercício). As operações para gerar valores fictícios envolvem dimensionar valores aleatórios para a faixa da coluna com um fator de escala e deslocar os valores.

A função rand() já foi importada para você a partir de numpy.random.

Este exercício faz parte do curso

Lidando com Dados Ausentes em Python

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

def fill_dummy_values(df):
  df_dummy = df.copy(deep=True)
  for col_name in df_dummy:
    col = df_dummy[col_name]
    # Calculate column range
    col_range = ___ - ___
  return df_dummy
Editar e executar o código