1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Rekurentní neuronové sítě (RNN) pro jazykové modelování s Keras

Connected

Cvičení

Seznámení s textovými daty

V tomto cvičení si pohraješ s textovými daty – konkrétně s citáty Sheldona Coopera ze seriálu Teorie velkého třesku. Získáš tak příležitost analyzovat věty a zjistit, jak to vypadá při práci s reálnými textovými daty.

Pomocí slovníkových comprehensions vytvoříš slovníky, které mapují slova na indexy a naopak. Slovníky místo například pandas.DataFrame volíme proto, že jsou intuitivnější a nepřidávají zbytečnou složitost.

Data jsou dostupná v proměnné sheldon_quotes – první dvě věty jsou už za tebe vypsané.

Pokyny

100 XP
  • Spoj věty do jedné proměnné pomocí join, extrahuj všechna slova a výsledný seznam ulož do all_words.
  • Odstraň duplicitní slova pomocí list(set()) na seznamu slov a výsledek ulož do unique_words.
  • Pomocí slovníkového comprehension vytvoř slovník, kde klíče jsou indexy a hodnoty jsou slova.
  • Pomocí slovníkového comprehension vytvoř slovník, kde klíče jsou slova a hodnoty jsou indexy.