Wie is belangrijk in het gesprek?

Verschillende centraliteitsmaten proberen allemaal hetzelfde concept te vangen: "welke knopen zijn het belangrijkst." Zoals we eerder bespraken, pakken deze twee statistieken dat net iets anders aan. Houd er rekening mee dat hoewel ze een vergelijkbare verdeling van centraliteitswaarden kunnen opleveren, de rangorde van een individuele knoop per maat kan verschillen. We gaan nu de hoogst scorende knopen van Twitter-gebruikers vergelijken.

De vectoren met respectievelijk eigenvector- en betweenness-centraliteit zijn opgeslagen als retweet_ec en retweet_btw.

Deze oefening maakt deel uit van de cursus

Casestudies: netwerkanalyse in R

Oefeninstructies

Bereken het 0.99-kwantiel van de betweenness, retweet_btw.
Maak een subset van retweet_btw met waarden groter dan dit kwantiel om de bovenste 1% te behouden.
Doe hetzelfde voor eigenvector-centraliteit, retweet_ec.
Voer de code uit die dit in een data frame zet en bekijk de resultaten.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Get 0.99 quantile of betweenness 
betweenness_q99 <- quantile(___, ___)

# Get top 1% of vertices by betweenness
top_btw <- ___[retweet_btw > ___]

# Get 0.99 quantile of eigen-centrality
eigen_centrality_q99 <- ___(___, ___)

# Get top 1% of vertices by eigen-centrality
top_ec <- ___

# See the results as a data frame
data.frame(
  Rank = seq_along(top_btw), 
  Betweenness = names(sort(top_btw, decreasing = TRUE)), 
  EigenCentrality = names(sort(top_ec, decreasing = TRUE))
)

Code bewerken en uitvoeren

Deze oefening maakt deel uit van de cursus

Casestudies: netwerkanalyse in R

SkillTag.level.beginnerSkillTag.label

4.8+

Begin gratis met de cursus

In dit hoofdstuk verken je een subset van een Amazon-aankooppgraf. Je bouwt voort op wat je al hebt geleerd, vindt belangrijke producten en ontdekt wat aankopen aanstuurt. Je bekijkt ook hoe grafen door de tijd kunnen veranderen door naar de graaf in verschillende perioden te kijken.

Exercise 1: Je gegevensset verkennen Exercise 2: Dyaden en triaden vinden Exercise 3: Clustering en wederkerigheid Exercise 4: Belangrijke producten Exercise 5: Wat maakt een product belangrijk?Exercise 6: Tijdelijke structuur verkennen Exercise 7: Metrieken door de tijd Exercise 8: Statistieken in de tijd plotten

In deze les verken je Twitter-data over R door te kijken naar gesprekken met '#rstats'. Eerst bekijk je de ruwe data en denk je na over hoe je je graaf wilt opbouwen. Er zijn verschillende manieren om dit te doen, en we behandelen er twee: retweets en mentions. Je bouwt die grafen en vergelijkt ze vervolgens op een aantal statistieken.

Exercise 1: Je retweet-grafiek maken Exercise 2: Visualiseer de graaf Exercise 3: Visualiseer knopen op basis van graad Exercise 4: Wat is de verdeling van centraliteit?Exercise 5: Wie is belangrijk in het gesprek?

Huidige oefening

Exercise 6: Belangrijke knopen plotten Exercise 7: Een mentions-grafiek maken Exercise 8: Vermeldings- vs. retweetgrafiek vergelijken Exercise 9: Assortativiteit en wederkerigheid Exercise 10: Uitvinden wie met wie praat Exercise 11: Gemeenschappen vinden Exercise 12: Community-algoritmes vergelijken Exercise 13: Gemeenschappen visualiseren

In dit hoofdstuk analyseer je data van een netwerk voor deelfietsen in Chicago. We bouwen voort op de concepten uit de introductiecursus en voegen er een paar nieuwe aan toe om grafen met gewogen randen te behandelen. Je start ook met data in een iets rauwere vorm en bekijkt hoe je je graaf opbouwt vanuit een gegevensbron die je mogelijk vindt.

Exercise 1: Een graaf maken vanuit ruwe data Exercise 2: Grafen maken voor verschillende gebruikerstypen Exercise 3: Vergelijk grafen van verschillende gebruikerstypes Exercise 4: Vergelijk graafafstand met geografische afstand Exercise 5: Afstanden van abonnees vs. niet-abonnees vergelijken Exercise 6: Meest bereisde vertrek- en aankomststations Exercise 7: Meest bereisde vertrek- en aankomststations met gewichten Exercise 8: Visualiseer centrale knooppunten Exercise 9: Gewogen centraliteitsmaten Exercise 10: Connectiviteit Exercise 11: Vind de minimale snede 1 Exercise 12: Vind de minimum cut 2 Exercise 13: Ongerichte clusterrandomisaties Exercise 14: Gewogen clustering-randomisaties

Tot nu toe hebben we alles geplot met igraph. Dat biedt veel krachtige manieren om je grafgegevens te plotten. Veel mensen werken echter liever met andere plottingframeworks zoals ggplot2, of zelfs interactieve frameworks zoals d3.js. In deze les bekijk je andere plottinglibraries die voortbouwen op het ggplot2-framework. Je kijkt ook naar andere niet-"spaghetti"-achtige methoden zoals hive plots, en naar het bouwen van interactieve en geanimeerde plots.

Exercise 1: Andere pakketten om grafen te plotten!Exercise 2: Basis van ggnet Exercise 3: Basis van ggnetwork Exercise 4: Meer ggnet-plotopties Exercise 5: Meer ggnetwork-plotopties Exercise 6: Interactieve visualisaties Exercise 7: Interactieve plots met ggiraph Exercise 8: Interactieve JavaScript-plots Exercise 9: Alternatieve visualisaties Exercise 10: Alternatieve manieren om een graaf te visualiseren: hive plots Exercise 11: BioFabric als een HTML-widget Exercise 12: Grafen plotten op een kaart