Metodika pro převod strukturovaných znalostí z oboru dialektologie do strojového učení

Metodika zpracovává problematiku přípravy a využití nářečních dat v dialektologii prostřednictvím moderních technologií strojového učení. Zaměřuje se na procesy konsolidace, standardizace a strukturování audiálních a textových materiálů, které tvoří základ pro vývoj automatických nástrojů pro transkripci řeči. Středobodem je představení postupů uplatnitelných při digitalizaci a normalizaci textových dat, obsahuje rovněž podrobný popis audiální dokumentace nářečí v terénu se zaměřením na různé explorační metody, a to včetně digitální archivace a katalogizace nahrávek.
Metodika propojuje teoretické poznatky o sběru a zpracování nářečního materiálu s praktickými postupy, které zahrnují nasazení strojového učení. Důraz je kladen na interdisciplinární přístup, který kombinuje lingvistické znalosti s technologickými nástroji pro automatizaci práce. Součástí metodiky jsou také postupy vizualizace dialektologických dat pomocí tematické kartografie, vedoucí k tvorbě interaktivních zvukových map či webových atlasů.
Dokument slouží nejen jako praktický průvodce pro přípravu specifického jazykového materiálu, ale i jako inspirace pro další výzkumné týmy, a to jak v oblasti dialektologie, tak v rámci širšího zapojení strojového učení do humanitních věd. Celý dokument je dostupný online na webu www.jamap.cz.