> Metodika pro převod strukturovaných znalostí z oboru dialektologie do strojového učení

Metodika pro převod strukturovaných znalostí z oboru dialektologie do strojového učení

Metodika pro převod strukturovaných znalostí z oboru dialektologie do strojového učení

Metodika zpracovává problematiku přípravy a využití nářečních dat v dialektologii prostřednictvím moderních technologií strojového učení. Zaměřuje se na procesy konsolidace, standardizace a strukturování audiálních a textových materiálů, které tvoří základ pro vývoj automatických nástrojů pro transkripci řeči. Středobodem je představení postupů uplatnitelných při digitalizaci a normalizaci textových dat, obsahuje rovněž podrobný popis audiální dokumentace nářečí v terénu se zaměřením na různé explorační metody, a to včetně digitální archivace a katalogizace nahrávek.

Metodika propojuje teoretické poznatky o sběru a zpracování nářečního materiálu s praktickými postupy, které zahrnují nasazení strojového učení. Důraz je kladen na interdisciplinární přístup, který kombinuje lingvistické znalosti s technologickými nástroji pro automatizaci práce. Součástí metodiky jsou také postupy vizualizace dialektologických dat pomocí tematické kartografie, vedoucí k tvorbě interaktivních zvukových map či webových atlasů.

Dokument slouží nejen jako praktický průvodce pro přípravu specifického jazykového materiálu, ale i jako inspirace pro další výzkumné týmy, a to jak v oblasti dialektologie, tak v rámci širšího zapojení strojového učení do humanitních věd. Celý dokument je dostupný online na webu www.jamap.cz.

Nejnovější aktuality

22. října 2024

Redakce Naší řeči vyzývá k zasílání příspěvků do speciálního tematického čísla Naší řeči 4/2025, které se bude věnovat genderové problematice v češtině. Hostujícími editorkami čísla jsou Tamah Sherman a Helena Özörencik. Bližší podrobnosti naleznete na stránkách časopisu v sekci tematická...

přečíst
25. září 2024

V době konání letních olympijských her byla ve veřejném prostoru často diskutována otázka, zda je přijatelné přechylovat příjmení cizích sportovkyň a zároveň nepřechylovat příjmení českých účastnic, která mají oficiálně nepřechýlenou podobu, a to i v rámci jednoho konkrétního komentáře. Úvodem je třeba...

přečíst
11. února 2025

Víte, jak zapsat peněžní částku slovy? A jak si poradíte se složenými číslovkovými výrazy – je baterie 9-ti voltová, nebo 9tivoltová, nebo je vhodné to napsat ještě jinak? Odpovědi najdete v jazykovém koutku Anny Černé v 1. čísle letošní Živy....

přečíst
30. ledna 2025

Nakladatelství Academia začátkem nového roku vydalo publikaci Miloslava Vondráčka Gramatické kategorie substantiv. Centrem autorova zájmu jsou významy mluvnických kategorií vyjadřovaných podstatnými jmény – tedy rodu, životnosti, čísla a pádu. Autor teoreticky analyzuje a empiricky dokládá, jak tyto kategorie fungují z hlediska jazykového systému...

přečíst
30. ledna 2025

Tento svazek je prvním svazkem slovníku etymologicky vykládajícího slovní zásobu češtiny do konce 15. století. Obsahuje také metodologické zásady tohoto vědeckého díla, plánovaného na několik desetiletí.

přečíst
29. ledna 2025

Oblíbená školní soutěž Staň se superdialektologem je zpět! Ústav pro jazyk český Akademie věd ČR znovu vyzývá žáky a žákyně základních a středních škol, aby se stali „superhrdiny“ dialektologie a pomohli dokumentovat jazykové bohatství regionů České republiky. „Agenti“ či „agentky“ ve věku 10–19 let se do projektu mohou...

přečíst