This is an old revision of the document!


DHmed

V této hodině se budeme věnovat samotným základům zpracování, analýzy a vizualizace digitalizovaných textových dat.

Projdeme a vyzkoušíme si spustit jednoduchý kód pro programovací jazyk python, na kterém si vyjasníme některé klíčové principy.

Výchozí otázky:

  • Co je to distanční čtení a k čemu jej lze použít?
  • Jaké jsou nevýhody zaužívaných nástrojů pro práci s korpusy?
  • Co je to model “bag-of-words?

https://colab.research.google.com/drive/1X6_tEfynM-vBNcquT6jeZzUOdNgqoyJN

Last modified: le 2018/03/29 08:06