Binäre Klassifikation
Es gibt zwei Arten des überwachten Lernens: Klassifikation und Regression. Die binäre Klassifikation wird verwendet, um eine Zielvariable vorherzusagen, die nur zwei Labels hat. Diese werden in der Regel numerisch mit einer 0 oder einer 1 dargestellt.
Der Kopf eines Datensatzes namens churn_df
wurde mittels .head()
ausgegeben und ist unten abgebildet. Du kannst davon ausgehen, dass der restliche Datensatz ähnliche Werte enthält.
account_length total_day_charge total_eve_charge total_night_charge total_intl_charge customer_service_calls churn
0 101 45.85 17.65 9.64 1.22 3 1
1 73 22.30 9.05 9.98 2.75 2 0
2 86 24.62 17.53 11.49 3.13 4 0
3 59 34.73 21.02 9.66 3.24 1 0
4 129 27.42 18.75 10.11 2.59 1 0
Welche Spalte könnte bei diesen Daten die Zielvariable für die binäre Klassifikation sein?
Diese Übung ist Teil des Kurses
Überwachtes Lernen mit scikit-learn
Interaktive Übung
Setze die Theorie in einer unserer interaktiven Übungen in die Praxis um
