ComeçarComece de graça

O que estamos prevendo?

Qual destes campos (ou colunas) é o valor que estamos tentando prever?

  • TAXES
  • SALESCLOSEPRICE
  • DAYSONMARKET
  • LISTPRICE

Este exercício faz parte do curso

Feature Engineering com PySpark

Ver curso

Instruções do exercício

  • A partir das colunas listadas acima, identifique qual usaremos como nossa variável dependente $Y$.
  • Usando o conjunto de dados carregado df, filtre-o para manter apenas a variável dependente com select(). Guarde esse dataframe na variável Y_df.
  • Exiba estatísticas resumidas da variável dependente usando describe() em Y_df e chamando show() para exibir.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Select our dependent variable
Y_df = df.____([____])

# Display summary statistics
Y_df.____().____()
Editar e executar o código