DHmed

“But if you are not making anything, you are not — in my less-than-three-minute opinion — a digital humanist. You might be something else that is good and worthy — maybe you’re a scholar of new media, or maybe a game theorist, or maybe a classicist with a blog (the latter being very good thing indeed) — but if you aren’t building, you are not engaged in the “methodologization” of the humanities, which, to me, is the hallmark of the discipline that was already decades old when I came to it.” (Stephen Ramsay, “Who's in? Who's out?”)


V této hodině se budeme věnovat samotným základům zpracování, analýzy a vizualizace digitalizovaných textových dat.

Projdeme a vyzkoušíme si spustit jednoduchý kód pro programovací jazyk python, na kterém si vyjasníme některé klíčové principy.

Výchozí otázky:

  • Co je to distanční čtení a k čemu jej lze použít?
  • Jaké jsou nevýhody zaužívaných nástrojů pro práci s korpusy?
  • Co je to model “bag-of-words?

Interaktivní kód (k původní verzi souboru se také můžete vrátit prostřednictvím GitHubu zde)

Dokument pro sdílení dat

Pokud budeme pracovat s latinskými a řeckými texty, tak především s těmi dostupnými přes projekt Open Greek and Latin

Možná si vyzkoušíme i některé nástroje z pythonovské knihovny pro práci s klasickými jazyky CLTK

A třeba se podíváme na mé vlastní vizualizace zde.


Last modified: le 2018/03/29 08:55