Proporções
Proporções estão por toda parte. Seja quilometragem por litro ou taxa de cliques, elas aparecem em muitos contextos. Neste exercício, vamos criar algumas proporções dividindo pares de colunas.
Este exercício faz parte do curso
Feature Engineering com PySpark
Instruções do exercício
- Crie uma nova variável
ASSESSED_TO_LISTdividindoASSESSEDVALUATIONporLISTPRICEpara entendermos se ter um valor de avaliação alto ou baixo impacta nosso preço. - Crie outra variável
TAX_TO_LISTpara estimarmos a alíquota aproximada de imposto dividindoTAXESporLISTPRICE. - Por fim, crie a variável
BED_TO_BATHSpara sabermos quão “disputados” podem ficar os banheiros, dividindoBEDROOMSporBATHSTOTAL.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# ASSESSED_TO_LIST
df = ____
df[['ASSESSEDVALUATION', 'LISTPRICE', 'ASSESSED_TO_LIST']].show(5)
# TAX_TO_LIST
df = ____
df[['TAX_TO_LIST', 'TAXES', 'LISTPRICE']].show(5)
# BED_TO_BATHS
df = ____
df[['BED_TO_BATHS', 'BEDROOMS', 'BATHSTOTAL']].show(5)