> Metodika pro převod strukturovaných znalostí z oboru dialektologie do strojového učení

Metodika pro převod strukturovaných znalostí z oboru dialektologie do strojového učení

Metodika pro převod strukturovaných znalostí z oboru dialektologie do strojového učení

Metodika zpracovává problematiku přípravy a využití nářečních dat v dialektologii prostřednictvím moderních technologií strojového učení. Zaměřuje se na procesy konsolidace, standardizace a strukturování audiálních a textových materiálů, které tvoří základ pro vývoj automatických nástrojů pro transkripci řeči. Středobodem je představení postupů uplatnitelných při digitalizaci a normalizaci textových dat, obsahuje rovněž podrobný popis audiální dokumentace nářečí v terénu se zaměřením na různé explorační metody, a to včetně digitální archivace a katalogizace nahrávek.

Metodika propojuje teoretické poznatky o sběru a zpracování nářečního materiálu s praktickými postupy, které zahrnují nasazení strojového učení. Důraz je kladen na interdisciplinární přístup, který kombinuje lingvistické znalosti s technologickými nástroji pro automatizaci práce. Součástí metodiky jsou také postupy vizualizace dialektologických dat pomocí tematické kartografie, vedoucí k tvorbě interaktivních zvukových map či webových atlasů.

Dokument slouží nejen jako praktický průvodce pro přípravu specifického jazykového materiálu, ale i jako inspirace pro další výzkumné týmy, a to jak v oblasti dialektologie, tak v rámci širšího zapojení strojového učení do humanitních věd. Celý dokument je dostupný online na webu www.jamap.cz.

Nejnovější aktuality

22. října 2024

Redakce Naší řeči vyzývá k zasílání příspěvků do speciálního tematického čísla Naší řeči 4/2025, které se bude věnovat genderové problematice v češtině. Hostujícími editorkami čísla jsou Tamah Sherman a Helena Özörencik. Bližší podrobnosti naleznete na stránkách časopisu v sekci tematická...

přečíst
10. března 2025

V nakladatelství Routledge vyšla kniha Wallachian Mobility and Settlement along the Carpathian Arc. Kapitolou o jazykových karpatismech ve východomoravských dialektech do ní přispěli Vít Boček (etymologické oddělení) a Marta Šimečková (dialektologické oddělení). Bližší informace o publikaci naleznete na tomto odkazu.

přečíst
4. března 2025

Ústav pro jazyk český AV ČR, v. v. i., vyhlašuje v souladu se zákonem č. 283/1992 Sb., o Akademii věd České republiky, ve znění zákona č. 420/2025 Sb., a Stanovami AV ČR výběrové řízení na pozici: Odborná pracovnice / odborný pracovník výzkumu a vývoje v oddělení současné lexikologie a lexikografie. Náplň práce:...

přečíst
3. března 2025

Srdečně vás zveme na přednášku Anny Michalcové (oddělení vývoje jazyka) s názvem Bible cisterciácká (1456) jako pramen k poznání staročeské kvantity. Přednášku pořádá Kruh přátel českého jazyka a uskuteční se ve středu 12. března 2025 od 18:00 v posluchárně č. 18 na Filozofické fakultě UK, náměstí Jana Palacha 2, Praha 1. Anotaci přednášky...

přečíst
26. února 2025

Ústav pro jazyk český AV ČR a Česká centra vás zvou ke sledování on-line přednášky s názvem Jazyková popularizace mezi vědou a influencery: Kde se míjíme a kde se můžeme potkat? Přednáška, kterou prosloví Martin Beneš z oddělení jazykové kultury ÚJČ, bude vysílána přes platformu ZOOM ve čtvrtek 20. 3. 2025...

přečíst