> Řešené projekty
Zobrazit menu

Řešené projekty

LINDAT/CLARIAH-CZ – Přístrojové vybavení
Ministerstvo školství, mládeže a tělovýchovy ČR – Operační program Jan Amos Komenský
Registrační číslo: CZ.02.01.01/00/23_015/0008176
Název výzvy: Výzva č. 02-23-016 Výzkumné e-infrastruktury I – OP JAK
Řešitel: prof. RNDr. Jan Hajič, Dr., Matematicko-fyzikální fakulta Univerzity Karlovy
Spoluřešitel za ÚJČ: PhDr. Martin Prošek, Ph.D., Ústav pro jazyk český AV ČR
Doba řešení: 2024–2026

„Dokonáno. Nalij vína paní Anno“. Jazykové experimenty ve středověkých písařských přípiscích a kolofonech
Grantová agentura ČR
Anotace: Projekt zaplňuje mezeru ve výzkumu středověké transmise textů a rukopisné kultury: zaměřuje se na studium kolofonů a písařských přípisků na konci textů. Kolofony jsou významné, protože podávají informaci o okolnostech vzniku daného rukopisného exempláře; informace o nich jsou však rozesety po katalozích rukopisů, a proto nebyly dosud prostudovány ve srovnávací perspektivě. Ostatní písařské přípisky, které jsou často hravé, vulgární, nebo nesmyslné a kombinují latinu s národním jazykem, pak v katalozích obvykle chybí zcela. Jde o bohatý a z větší části needitovaný materiál. Tento projekt se zaměří na studium jazykové inovace a literárních aspektů písařských přípisků a kolofonů ze středověkých českých zemí, tedy především v latině a češtině. Jako nástroj pro tuto analýzu bude vytvořena komplexní databáze. Výsledky přinesou nové poznatky týkající se staré češtiny, jazykových experimentů a code-switching, ale také písařské kultury a dějin všedního dne.
Registrační číslo: 24-10628S
Hlavní řešitelka: prof. Mgr. Lucie Doležalová, Ph.D., Fakulta humanitních studií UK
Spoluřešitelka: Mgr. Andrea Hlaváčová Svobodová, Ph.D., Ústav pro jazyk český AV ČR
Doba řešení: 2024–2026

Atlas českého jazyka 2027: celoúzemní výzkum nářečí českého jazyka po 50 letech
Ministerstvo kultury – program NAKI III
Anotace: Cílem projektu je novým, modernizovaným celoúzemním výzkumem nářečí českého jazyka identifikovat jejich současný stav, zdůvodnit změny v jejich regionální distribuci a výsledky prezentovat v Atlase českého jazyka. Stane se tak v době, kdy uplyne 50 let od posledního celoúzemního výzkumu nářečí, realizovaného dialektology Ústavu pro jazyk český. Ten zachytil archaický stav českých nářečí, popsaný pak v šestidílném Českém jazykovém atlase. Od té doby prošla nářečí velkými změnami vyvolanými faktory sociálními, hospodářskými a politickými. Projekt naváže na zkušenosti z předchozích bádání. S využitím pokroku v rozvoji informačních technologií vzniknou výsledky, jež povýší výkon i kvalitu dialektologického výzkumu a budou uplatnitelné i pro budoucí generace dialektologů: 1) softwarový nástroj použitelný při moderních metodách sběru, ukládání, správě, zpracování a vizualizaci různých typů nářečních dat; v nich se projeví i zaměření ke zkoumání sociálně stratifikovaných variací; 2) metodika pro sběr dialektologického materiálu, definující a popisující metody přímého a nepřímého výzkumu. S jejich pomocí shromáždí nářeční data, jež bude prezentovat: 3) analytická interaktivní multimediální mapa zobrazující nářeční materiál z tematických okruhů člověk, jeho život a okolní prostředí; 4) syntetická interaktivní multimediální mapa znázorňující nářeční oblasti ve smyslu regionalizace; 5) specializovaná veřejná prostorová geodatabáze nářečních lexikálních dat s geolokací, umožňující volitelně generovat přehledné sestavy dat na základě vybraných sociolingvistických kritérií; 6) výstava (s kritickým katalogem) prezentující současný stav nářečí v konfrontaci s výsledky výzkumu uskutečněného před 50 lety; 7) Atlas českého jazyka, hlavní publikační výstup s 550 analytickými a syntetickými mapami a odborným komentářem. Dále vzniknou čtyři tematické atlasy, odborné články a bude uspořádána konference.
Identifikační kód: DH23P03OVV050
Hlavní řešitel: PhDr. Martina Ireinová, Ph.D., Ústav pro jazyk český AV ČR
Spoluřešitel: prof. RNDr. Vít Voženílek, CSc., Přírodovědecká fakulta Univerzity Palackého v Olomouci
Doba řešení: 2023–2027

Jazyková paměť regionů České republiky. Metody strojového učení pro uchování, dokumentaci a prezentaci nářečí českého jazyka
Ministerstvo kultury ČR – program NAKI III
Anotace: Cílem projektu je adaptovat existující technologie a vyvinout zcela nové postupy pro využití umělé inteligence při automatickém zpracování přirozeného mluveného jazyka v jeho regionálně rozrůzněné podobě, konkrétně na modelu českých nářečí. Půjde o první projekt svého druhu – automatické rozpoznávání řeči bylo dosud aplikováno výhradně na promluvy s majoritním zastoupením spisovných prvků. Takto jedinečný projekt výrazným způsobem zefektivní práci s autentickým zvukovým materiálem, jehož ruční zpracování je (nejen pro jazykovědce) za současných podmínek časově nesmírně náročné. Zároveň umožní snazší a efektivnější dokumentaci nářečí českého jazyka a interaktivní prezentaci tohoto mizejícího jazykového dědictví. Cíl bude dosažen (1) tvorbou inovativní Metodiky pro převod strukturovaných znalostí z oboru dialektologie do strojového učení, (2) intenzivní prací na datových sadách, především vybudováním Databáze nářečních promluv pro odbornou veřejnost, jejíž naplnění reprezentativními audiozáznamy zajistí jeden z partnerů projektu, disponující největším interním archivem nahrávek tohoto druhu v ČR, (3) tvorbou několika softwarů, jmenovitě Automatického detektoru dialektu na základě audionahrávky, Rozpoznávače řeči adaptovaného pro generování dialektologické transkripce z audionahrávek a Multilingválního rozpoznávače západoslovanských jazyků pro generování folklorní transkripce z audionahrávek, (4) tvorbou tří specializovaných Map nářečních diferenčních hláskových jevů s interaktivními a multimediálními prvky, a především (5) tvorbou aplikace Jazyková paměť regionů České republiky. Ta bude otevřená široké veřejnosti pro komunitní doplňování, mapové zobrazování a poslech nářečních nahrávek. Publikační stránka projektu bude reprezentována odbornou knihou a řadou časopiseckých a konferenčních publikací.
Identifikační kód: DH23P03OVV010
Hlavní řešitel: Ing. Martin Karafiát, Ph.D., Fakulta informačních technologií Vysokého učení technického v Brně
Spoluřešitelé: Mgr. Marta Šimečková, Ph.D., Ústav pro jazyk český AV ČR; prof. RNDr. Vít Voženílek, CSc., Přírodovědecká fakulta Univerzity Palackého v Olomouci
Doba řešení: 2023–2027

LINDAT/CLARIAH-CZ – Digitální výzkumná infrastruktura pro jazykové technologie, umění a humanitní vědy
Ministerstvo školství, mládeže a tělovýchovy ČR
Registrační číslo: LM2023062
Řešitel: prof. RNDr. Jan Hajič, Dr., Matematicko-fyzikální fakulta Univerzity Karlovy
Spoluřešitel za ÚJČ: PhDr. Martin Prošek, Ph.D., Ústav pro jazyk český AV ČR
Doba řešení: 2023–2026