Eine numerische Variable in einen Faktor gruppieren
Dein alter Freund Dan hat dir eine Liste von 50 Anleihen mit AAA-Rating geschickt, AAA_rank. Jede Anleihe hat zusätzlich eine Zahl von 1–100, die beschreibt, wie profitabel er diese Anleihe einschätzt (100 = am profitabelsten). Du willst seine Vorschläge weiter analysieren, aber zuerst wäre es hilfreich, wenn die Anleihen irgendwie nach ihrer Bewertung in Gruppen eingeteilt wären. So kannst du Anleihen von am wenigsten bis am meisten profitabel gruppieren und leichter analysieren.
Das ist ein gutes Beispiel dafür, wie man aus einem numerischen Vektor einen Faktor erstellt. Am einfachsten geht das mit cut(). Unten wird Dans Bewertung von 1–100 in 5 gleich große Gruppen aufgeteilt. Beachte: Die ( in den Faktor-Levels bedeutet, dass die danebenstehende Zahl in dieser Gruppe nicht enthalten ist; die ] bedeutet, dass diese Zahl enthalten ist.
head(AAA_rank)
[1] 31 48 100 53 85 73
AAA_factor <- cut(x = AAA_rank, breaks = c(0, 20, 40, 60, 80, 100))
head(AAA_factor)
[1] (20,40] (40,60] (80,100] (40,60] (80,100] (60,80]
Levels: (0,20] (20,40] (40,60] (60,80] (80,100]
In der Funktion cut() kannst du mit breaks = die Gruppen festlegen, nach denen R deine Daten einteilt!
Diese Übung ist Teil des Kurses
Einführung in R für Finance
Anleitung zur Übung
- Kannst du statt 5 nur 4 Buckets erstellen? Verwende in
breaks =einen Vektor von 0 bis 100, bei dem jedes Element 25 Zahlen auseinanderliegt. Weisen ihnAAA_factorzu. - Die 4 Buckets haben keine sehr aussagekräftigen Namen. Verwende
levels(), um die Levels in dieser Reihenfolge umzubenennen:"low","medium","high"und"very_high". - Gib das neu benannte
AAA_factoraus. - Zeichne
AAA_factor, um deine Arbeit zu visualisieren!
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create 4 buckets for AAA_rank using cut()
AAA_factor <- cut(x = ___, breaks = ___)
# Rename the levels
# Print AAA_factor
# Plot AAA_factor
plot(___)