Matrix-Sparsity

Eine häufige Herausforderung bei Bewertungen aus der Praxis ist, dass die meisten Nutzer die meisten Items nicht bewertet haben und die meisten Items nur von wenigen Nutzern bewertet wurden. Das führt zu einem sehr leeren bzw. dünn besetzten (spars) DataFrame.

In dieser Übung berechnest du, wie dünn besetzt die movie_lens-Bewertungsdaten sind, indem du die Anzahl der belegten Zellen zählst und sie mit der Größe des vollständigen DataFrames vergleichst. Der DataFrame user_ratings_df, den du in früheren Übungen verwendet hast und der pro Nutzer eine Zeile und pro Film eine Spalte enthält, wurde für dich geladen.

Diese Übung ist Teil des Kurses

<Kurs>Recommendation Engines mit Python entwickeln</Kurs>

Kurs ansehen

Übungsanweisungen

Zähle die Anzahl der nicht leeren Zellen in user_ratings_df und speichere das Ergebnis als sparsity_count.
Ermittle die Gesamtzahl der Zellen im DataFrame user_ratings_df und speichere sie als full_count.
Berechne die Sparsity des DataFrames, indem du die Anzahl der nicht leeren Zellen durch die Gesamtzahl der Zellen teilst, und gib das Ergebnis aus.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Count the occupied cells
sparsity_count = user_ratings_df.____().____.____()

# Count all cells
full_count = user_ratings_df.____

# Find the sparsity of the DataFrame
sparsity = ____ / ____
print(sparsity)

Code bearbeiten und ausführen