Erste SchritteKostenlos loslegen

Vom Dictionary zum DataFrame (1)

pandas ist eine Open-Source-Bibliothek und bietet leistungsstarke, einfach zu nutzende Datenstrukturen und Datenanalysetools für Python. Klingt vielversprechend!

Der DataFrame ist eine der wichtigsten Datenstrukturen von pandas. Im Prinzip können damit tabellarische Daten gespeichert und die Zeilen und Spalten beschriftet werden. Um einen DataFrame zu erstellen, kannst du zum Beispiel ein Dictionary verwenden.

In den folgenden Übungen wirst du mit Fahrzeugdaten aus verschiedenen Ländern arbeiten. Jede Beobachtung, also jede Zeile, entspricht einem Land. Die Spalten enthalten Informationen dazu, wie viele Fahrzeuge pro Kopf es gibt, ob Links- oder Rechtsverkehr gilt und so weiter.

In dem Skript sind drei Listen definiert:

  • names mit den Namen der Länder, für die Daten verfügbar sind,
  • dr mit booleschen Werten zur Angabe, ob die Menschen in dem jeweiligen Land links oder rechts fahren, und
  • cpc mit der Anzahl an Kraftfahrzeugen pro 1000 Menschen in dem jeweiligen Land.

Jeder Dictionary-Schlüssel ist eine Spaltenbezeichnung und jeder Wert ist eine Liste mit den entsprechenden Spaltenelementen.

Diese Übung ist Teil des Kurses

Python für Fortgeschrittene

Kurs anzeigen

Anleitung zur Übung

  • Importiere pandas als pd.

  • Verwende die vordefinierten Listen, um ein Dictionary namens my_dict zu erstellen. Es sollten drei Schlüssel:Wert-Paare vorhanden sein:

    • Schlüssel 'country' und Wert names.

    • Schlüssel 'drives_right' und Wert dr.

    • Schlüssel 'cars_per_cap' und Wert cpc.

  • Verwende pd.DataFrame(), um dein Diktat in einen DataFrame namens cars zu verwandeln.

  • Gib cars aus und bewundere dein Werk!

Interaktive Übung zum Anfassen

Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.

# Pre-defined lists
names = ['United States', 'Australia', 'Japan', 'India', 'Russia', 'Morocco', 'Egypt']
dr =  [True, False, False, False, True, True, True]
cpc = [809, 731, 588, 18, 200, 70, 45]

# Import pandas as pd


# Create dictionary my_dict with three key:value pairs: my_dict


# Build a DataFrame cars from my_dict: cars


# Print cars
Bearbeiten und Ausführen von Code