1. Nauka
  2. /
  3. Kursy
  4. /
  5. Analiza sentymentu w R

Connected

ćwiczenie

Krok 2: Identyfikacja źródeł tekstu

W tym krótkim ćwiczeniu wczytasz i przeanalizujesz mały zbiór recenzji wynajmu nieruchomości z okolic Bostonu. Zapewne znasz już funkcję read.csv(), która pozwala wczytać plik CSV. Może się to wydawać prozaiczne, ale celem tego rozdziału jest przeprowadzenie cię przez cały proces analizy – od początku do końca. Zacznijmy zatem od wczytania danych!

Następnie zastosuj str() do ramki danych, aby poznać jej strukturę. To wygodna funkcja, która w zwięzłej formie wyświetla pierwsze wartości i typy danych wektorów.

Na koniec użyj dim(), aby wyświetlić wymiary ramki danych. W konsoli zobaczysz liczbę wierszy i liczbę kolumn.

Do eksploracji danych często używa się też funkcji takich jak head(), tail() czy summary() – tutaj jednak ograniczamy wstępną analizę do minimum, żebyś jak najszybciej dotarł do sedna, czyli analizy wydźwięku!

Instrukcje

100 XP

Recenzje wynajmu nieruchomości z Bostonu są przechowywane w pliku CSV, którego ścieżkę zawiera predefiniowana zmienna bos_reviews_file.

  • Wczytaj recenzje z bos_reviews_file za pomocą read.csv(). Nadaj obiektowi nazwę bos_reviews.
  • Zbadaj strukturę ramki danych, stosując funkcję str() na obiekcie bos_reviews.
  • Sprawdź, ile recenzji masz do analizy, wywołując dim() na bos_reviews.