Aan de slagBegin gratis

Een big.matrix-object inlezen

In deze oefening maak je je eerste file-backed big.matrix-object met de functie read.big.matrix(). De functie lijkt op read.table(), maar heeft daarnaast extra informatie nodig: welk type numerieke waarden je wilt inlezen ("char", "short", "integer", "double"), de naam van het bestand dat de gegevens van de matrix zal bevatten (het backing-bestand), en de naam van het bestand dat informatie over de matrix bevat (het descriptorbestand). Het resultaat is een bestand op de schijf met de ingelezen waarden en een descriptorbestand met extra informatie (zoals het aantal kolommen en rijen) over het resulterende big.matrix-object.

Deze oefening maakt deel uit van de cursus

Schaalbare gegevensverwerking in R

Bekijk cursus

Oefeninstructies

  • Laad het bigmemory-pakket.
  • Gebruik de functie read.big.matrix() om het bestand "mortgage-sample.csv" in te lezen. Dit bestand bevat een header en bestaat uit gehele getallen. Daarnaast:
    • Maak een backing-bestand met de naam "mortgage-sample.bin", en
    • Een descriptorbestand met de naam "mortgage-sample.desc".
  • Bepaal de afmetingen van x met de functie dim().

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Load the bigmemory package
___

# Create the big.matrix object: x
x <- ___(___, header = ___, 
                     type = ___, 
                     backingfile = ___, 
                     descriptorfile = ___)
    
# Find the dimensions of x
___
Code bewerken en uitvoeren