Entendendo seus dados de classificação
Agora você começará a modelar com um novo conjunto de dados para um problema de classificação. Esses dados incluem informações sobre os passageiros do Titanic. Você usará preditores como age
, fare
e de onde cada passageiro embarcou para prever quem sobreviverá. Esses dados são de um tutorial sobre competições de ciência de dados. Veja aqui as descrições dos recursos.
Os dados são pré-carregados em um DataFrame do pandas chamado df
.
É inteligente revisar os valores máximo e mínimo de cada variável para garantir que os dados não estejam mal formatados ou corrompidos. Qual era a idade máxima dos passageiros do Titanic? Use o método .describe()
no shell IPython para responder a essa pergunta.
Este exercício faz parte do curso
Introdução à aprendizagem profunda em Python
Exercício interativo prático
Transforme a teoria em ação com um de nossos exercícios interativos
