ComeçarComece de graça

Criando um bag a partir de texto salvo

Desta vez, sua colega salvou as avaliações em alguns arquivos de texto. Há vários arquivos e várias avaliações em cada arquivo. Cada avaliação está em uma linha separada do arquivo de texto.

Você quer carregar isso no Dask de forma preguiçosa (lazy) para poder usar processamento paralelo e analisar tudo mais rápido.

dask.bag já foi importado para você como db.

Este exercício faz parte do curso

Programação Paralela com Dask em Python

Ver curso

Instruções do exercício

  • Use a função read_text() para carregar todos os arquivos .txt dentro do diretório data/tripadvisor_hotel_reviews.
  • Conte o número de avaliações no bag.
  • Use o método .compute() do bag para imprimir a resposta.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Load in all the .txt files inside data/tripadvisor_hotel_reviews
review_bag = ____

# Count the number of reviews in the bag
review_count = review_bag.____

# Compute and print the answer
print(____)
Editar e executar o código