Praktische Anwendung (1)

In den vorherigen Übungen hast du erste Erfahrungen mit dem Schreiben eigener Funktionen gemacht. Du hast gelernt, wie du Parameter zu deinen eigenen Funktionsdefinitionen hinzufügst, einen Wert oder mehrere Werte mit Tupeln zurückgibst und wie du die von dir definierten Funktionen aufrufst.

In dieser und der folgenden Übung bringst du all diese Konzepte zusammen und wendest sie auf ein einfaches Data-Science-Problem an. Du lädst einen Datensatz und entwickelst Funktionalitäten, um einfache Erkenntnisse aus den Daten zu gewinnen.

In dieser Übung sollst du dir noch einmal überlegen, wie man einen Datensatz in einen DataFrame lädt. Der Datensatz enthält Twitter-Daten und du iterierst über die Einträge in einer Spalte, um ein Wörterbuch zu erstellen, in dem die Schlüssel die Namen der Sprachen und die Werte die Anzahl der Tweets in der jeweiligen Sprache sind. Die Datei tweets.csv ist in deinem aktuellen Verzeichnis verfügbar.

Beachte, dass es sich hierbei um echte Daten von Twitter handelt und daher immer das Risiko besteht, dass sie Schimpfwörter oder andere anstößige Inhalte enthalten (gilt für diese und alle folgenden Übungen, die ebenfalls auf echte Twitter-Daten zurückgreifen).

Diese Übung ist Teil des Kurses

<Kurs>Einführung in Funktionen in Python</Kurs>

Kurs ansehen

Übungsanweisungen

Importiere das pandas-Paket mit dem Alias pd.
Importiere die Datei 'tweets.csv' mit der pandas-Funktion read_csv(). Weise den sich daraus ergebenden DataFrame df zu.
Schließe die for-Schleife ab, indem du über col die Spalte 'lang' im DataFrame df iterierst.
Vervollständige die Rümpfe der if-else-Anweisungen in der for-Schleife: Wenn der Schlüssel im Dictionary langs_count steht, füge 1 zu dem Wert hinzu, der diesem Schlüssel im Dictionary entspricht, sonst füge den Schlüssel zu langs_count hinzu und setze den entsprechenden Wert auf 1. Verwende die Schleifenvariable entry in deinem Code.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Import pandas


# Import Twitter data as DataFrame: df
df = ____

# Initialize an empty dictionary: langs_count
langs_count = {}

# Extract column from DataFrame: col
col = df['lang']

# Iterate over lang column in DataFrame
for entry in ____:

    # If the language is in langs_count, add 1 
    if entry in langs_count.keys():
        ____
    # Else add the language to langs_count, set the value to 1
    else:
        ____

# Print the populated dictionary
print(langs_count)

Code bearbeiten und ausführen