LoslegenKostenlos loslegen

Logarithmus- und Potenztransformationen

In der letzten Übung hast du die Verteilungen eines Trainings- und Testsets von loan_data verglichen. Das ist in einem Machine-Learning-Interview besonders wichtig, weil die beobachtete Verteilung vorgibt, ob du Techniken einsetzen solltest, die deine Feature-Verteilungen in Richtung Normalverteilung verschieben, damit Normalitätsannahmen nicht verletzt werden.

In dieser Übung verwendest du die Log- und Potenztransformation aus dem Modul scipy.stats auf das Feature Years of Credit History von loan_data zusammen mit der Funktion distplot() aus seaborn, die sowohl die Verteilung als auch die Kernel-Dichteschätzung (KDE) darstellt.

Alle relevanten Pakete wurden bereits für dich importiert.

Hier befindest du dich in der Pipeline:

Machine learning pipeline

Diese Übung ist Teil des Kurses

ML-Vorstellungsgespräche in Python üben

Kurs anzeigen

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Subset loan_data
cr_yrs = ____['____']

# Histogram and kernel density estimate
plt.figure()
sns.____(____)
plt.show()
Code bearbeiten und ausführen