> Řešené projekty

Řešené projekty

Participace skrze modlitbu v pozdně středověké a raně novověké střední Evropě
Ministerstvo školství, mládeže a tělovýchovy ČR – program INTER-EXCELLENCE II, podprogram INTER-COST
Anotace: Projekt má přinést komplexnější poznání středoevropských pramenů vztahujících se k pozdně středověké kultuře modlitby coby devoční formy. Zaměří se zejména na sociální struktury střední Evropy, chápané v užším slova smyslu jako území dnešní České republiky a sousední země (Německo, Rakousko, Maďarsko, Slovensko, Polsko), které dnes buď překrývají oblasti kdysi zapojené do chronologicky se proměňujícího státního útvaru zemí Koruny české, nebo s nimi bezprostředně kulturně souvisely (Uherské království spojené s Českými zeměmi na přelomu 15. a 16. století v personální unii). Projekt se soustředí na materiální aspekty kultury modliteb (např. tradice sestavování obsahu a výzdobu modlitebních rukopisů, přenos modliteb na další nosiče a agregáty textů, jako je mobiliář sakrálního prostoru – oltářní archy, samostatné deskové obrazy a sochy, liturgické předměty), stejně jako na sítě objednavatelů, uživatelů a výrobců. Důraz klade i na otázku jazykovou, kterou pojednává v komparativní perspektivě (srovnání s prameny polské a uherské provenience). Projekt překonává nedostatečný rozvoj výzkumu této oblasti v minulosti a sbližuje domácí medievistické bádání se současnými globálními trendy. Námětem svých výstupů úzce navazuje na hlavní projekt COST ve všech jeho pracovních skupinách. Zpřístupňuje zahraničním badatelům komplexní obraz lokálních specifik (časná vernakularizace modliteb, jinde se neopakující konfesijní situace související s husitskou reformací) a skrze aplikaci zahraničních metodologií na bohemikální materiál slibuje řadu vysoce kvalitních výsledků. Tomu pomáhá zapojení zahraničních badatelů, kteří budou spoluautory části výsledků. Vedle poznání středověké společnosti s akcentací genderových aspektů slibuje projekt přinést zhodnocení kulturního dědictví českých zemí a bude jej propagovat v širším mezinárodním hledisku.
Registrační číslo: LUC25097
Hlavní řešitel: Mgr. et Mgr. Jan Dienstbier, Ph.D. et Ph.D., Ústav dějin umění AV ČR
Spoluřešitelka za ÚJČ: Mgr. Kateřina Voleková, Ph.D.
Doba řešení: 2025–2028

Lexikální portál češtiny: adaptace dat pro digitální éru
Technologická agentura ČR – program SIGMA
Anotace: Prvotním cílem projektu je vytvoření online platformy, která bude poskytovat komplexní profil českých lexikálních jednotek opírající se jednak o jejich popis v dostupných slovnících češtiny, jednak o jejich užití zachycené v reálných textech, obsažených ve velkých jazykových korpusech. Projekt je následně zaměřen na rozvoj klíčových kompetencí studentů, resp. široké veřejnosti ve vztahu k užívání digitálních technologií. Vytvoření platformy je prostředkem k naplnění vzdělávacích cílů projektu, které zahrnují zejména důraz na posilování schopnosti interpretovat a kriticky posoudit jazykový obsah textů vnastupující digitální éře textů uměle generovaných umělou inteligencí.
Registrační číslo: TQ23000282
Hlavní řešitel: Mgr. Michal Škrabal, Ph.D., Filozofická fakulta Univerzity Karlovy
Spoluřešitel za ÚJČ: Mgr. Jan Křivan, Ph.D.
Doba řešení: 2025–2029

Inflection Points: Designing Language Tools for Practitioners
Arts and Humanities Research Council (AHRC)
Anotace: Projekt Inflection Points: Designing Language Tools for Practitioners se zaměřuje na jeden z nejnáročnějších aspektů osvojování češtiny a chorvatštiny – zvládání komplexní morfologické paradigmatiky běžně užívaných slov. Vychází z předchozího výzkumu financovaného AHRC, který ukázal, že rozpoznat, které z mnoha slovních tvarů patří k téže jednotce slovní zásoby, představuje pro děti v procesu jazykového vývoje, pro mluvčí jiných jazyků osvojujících si češtinu či chorvatštinu ipro pacienty s narušenou jazykovou schopností významnou kognitivní i didaktickou výzvu. Projekt propojuje lingvistický výzkum s aplikační perspektivou a převádí původně badatelské digitální nástroje do podoby prakticky využitelných pomůcek pro učitele, studující a logopedy. Ve spolupráci s odborníky z oblasti vzdělávání aklinické praxe budou dále rozvíjeny databáze a aplikace zaměřené na tvarovou variabilitu (např. chorvatské dvojtvary, vývoj dětského jazyka či českou deklinaci), a to s ohledem na potřeby pedagogů, učitelů češtiny achorvatštiny jako druhého, cizího jazyka a odborníků v oblasti jazykové terapie. Zvláštní pozornost je věnována také uživatelskému výzkumu Internetové jazykové příručky. Projekt přispívá k lepšímu porozumění vztahu mezi jazykovým územ a kodifikací a má výrazný společenský dopad, neboť schopnost správně užívat očekávané flektivní tvary pozitivně ovlivňuje vzdělávací a profesní příležitosti uživatelů jazyka.
Číslo: AH/Z507532/1
Hlavní řešitel: Prof. Dr. Neil Bermel, University of Sheffield
Spoluřešitelé z České republiky: Mgr. Martin Beneš, Ph.D. (Ústav pro jazyk český AV ČR), Mgr. Dominika Kováříková, M.A., Ph.D. (Ústav Českého národního korpusu FF UK)
Další spoluřešitelské instituce: University of Zagreb (Chorvatsko), Institute for the Croatian Language (Chorvatsko)
Doba řešení: 05/2025–04/2026

LINDAT/CLARIAH-CZ – Přístrojové vybavení
Ministerstvo školství, mládeže a tělovýchovy ČR – Operační program Jan Amos Komenský
Anotace: Projekt „LINDAT/CLARIAH-CZ Přístrojové vybavení“ spočívá v rozšíření výpočetních kapacit a kapacit datových úložišť pro výzkumnou infrastrukturu LINDAT/CLARIAH-CZ u žadatele a vybraných partnerů této výzkumné infrastruktury, u nichž byla potřeba obměnit či pořídit nové investice pro zajištění udržení infrastruktury v chodu, a na zvyšující se nároky na datovou i výpočetní kapacitu zejména ve společném repozitáři LINDAT/CLARIAH-CZ a v repozitářích partnerských kulturních institucí. Cílem projektu LINDAT/CLARIAH-CZ Přístrojové vybavení je posílit vytíženou a postupně zastarávající výpočetní infrastrukturu u žadatele a partnerů tak, aby bylo možné pokračovat ve výzkumu na hranici poznání NLP (především v metodách neuronových sítí, a využít tuto novou kapacitu na rozšíření expertízy a vylepšení existujících postupů a řešení rozličných úloh NLP a CL) a zároveň aby došlo k rozšíření výpočetní kapacity datových úložišť tak, aby byla udržena infrastruktura v plně funkčním stavu a mohla poskytovat datové zdroje v otevřeném režimu široké vědecké komunitě.
Registrační číslo: CZ.02.01.01/00/23_015/0008176
Název výzvy: Výzva č. 02-23-016 Výzkumné e-infrastruktury I – OP JAK
Řešitel: prof. RNDr. Jan Hajič, Dr., Matematicko-fyzikální fakulta Univerzity Karlovy
Spoluřešitel za ÚJČ: PhDr. Martin Prošek, Ph.D.
Doba řešení: 2024–2026

LINDAT/CLARIAH-CZ OP JAK obrázek

„Dokonáno. Nalij vína paní Anno“. Jazykové experimenty ve středověkých písařských přípiscích a kolofonech
Grantová agentura ČR
Anotace: Projekt zaplňuje mezeru ve výzkumu středověké transmise textů a rukopisné kultury: zaměřuje se na studium kolofonů a písařských přípisků na konci textů. Kolofony jsou významné, protože podávají informaci o okolnostech vzniku daného rukopisného exempláře; informace o nich jsou však rozesety po katalozích rukopisů, a proto nebyly dosud prostudovány ve srovnávací perspektivě. Ostatní písařské přípisky, které jsou často hravé, vulgární, nebo nesmyslné a kombinují latinu s národním jazykem, pak v katalozích obvykle chybí zcela. Jde o bohatý a z větší části needitovaný materiál. Tento projekt se zaměří na studium jazykové inovace a literárních aspektů písařských přípisků a kolofonů ze středověkých českých zemí, tedy především v latině a češtině. Jako nástroj pro tuto analýzu bude vytvořena komplexní databáze. Výsledky přinesou nové poznatky týkající se staré češtiny, jazykových experimentů a code-switching, ale také písařské kultury a dějin všedního dne.
Registrační číslo: 24-10628S
Hlavní řešitelka: prof. Mgr. Lucie Doležalová, Ph.D., Fakulta humanitních studií Univerzity Karlovy
Spoluřešitelka: Mgr. Andrea Hlaváčová Svobodová, Ph.D., Ústav pro jazyk český AV ČR
Doba řešení: 2024–2026

Atlas českého jazyka 2027: celoúzemní výzkum nářečí českého jazyka po 50 letech
Ministerstvo kultury – program NAKI III
Anotace: Cílem projektu je novým, modernizovaným celoúzemním výzkumem nářečí českého jazyka identifikovat jejich současný stav, zdůvodnit změny v jejich regionální distribuci a výsledky prezentovat v Atlase českého jazyka. Stane se tak v době, kdy uplyne 50 let od posledního celoúzemního výzkumu nářečí, realizovaného dialektology Ústavu pro jazyk český. Ten zachytil archaický stav českých nářečí, popsaný pak v šestidílném Českém jazykovém atlase. Od té doby prošla nářečí velkými změnami vyvolanými faktory sociálními, hospodářskými a politickými. Projekt naváže na zkušenosti z předchozích bádání. S využitím pokroku v rozvoji informačních technologií vzniknou výsledky, jež povýší výkon i kvalitu dialektologického výzkumu a budou uplatnitelné i pro budoucí generace dialektologů: 1) softwarový nástroj použitelný při moderních metodách sběru, ukládání, správě, zpracování a vizualizaci různých typů nářečních dat; v nich se projeví i zaměření ke zkoumání sociálně stratifikovaných variací; 2) metodika pro sběr dialektologického materiálu, definující a popisující metody přímého a nepřímého výzkumu. S jejich pomocí shromáždí nářeční data, jež bude prezentovat: 3) analytická interaktivní multimediální mapa zobrazující nářeční materiál z tematických okruhů člověk, jeho život a okolní prostředí; 4) syntetická interaktivní multimediální mapa znázorňující nářeční oblasti ve smyslu regionalizace; 5) specializovaná veřejná prostorová geodatabáze nářečních lexikálních dat s geolokací, umožňující volitelně generovat přehledné sestavy dat na základě vybraných sociolingvistických kritérií; 6) výstava (s kritickým katalogem) prezentující současný stav nářečí v konfrontaci s výsledky výzkumu uskutečněného před 50 lety; 7) Atlas českého jazyka, hlavní publikační výstup s 550 analytickými a syntetickými mapami a odborným komentářem. Dále vzniknou čtyři tematické atlasy, odborné články a bude uspořádána konference.
Identifikační kód: DH23P03OVV050
Hlavní řešitelka: PhDr. Martina Ireinová, Ph.D., Ústav pro jazyk český AV ČR
Spoluřešitel: prof. RNDr. Vít Voženílek, CSc., Přírodovědecká fakulta Univerzity Palackého v Olomouci
Doba řešení: 2023–2027

Jazyková paměť regionů České republiky. Metody strojového učení pro uchování, dokumentaci a prezentaci nářečí českého jazyka
Ministerstvo kultury ČR – program NAKI III
Anotace: Cílem projektu je adaptovat existující technologie a vyvinout zcela nové postupy pro využití umělé inteligence při automatickém zpracování přirozeného mluveného jazyka v jeho regionálně rozrůzněné podobě, konkrétně na modelu českých nářečí. Půjde o první projekt svého druhu – automatické rozpoznávání řeči bylo dosud aplikováno výhradně na promluvy s majoritním zastoupením spisovných prvků. Takto jedinečný projekt výrazným způsobem zefektivní práci s autentickým zvukovým materiálem, jehož ruční zpracování je (nejen pro jazykovědce) za současných podmínek časově nesmírně náročné. Zároveň umožní snazší a efektivnější dokumentaci nářečí českého jazyka a interaktivní prezentaci tohoto mizejícího jazykového dědictví. Cíl bude dosažen (1) tvorbou inovativní Metodiky pro převod strukturovaných znalostí z oboru dialektologie do strojového učení, (2) intenzivní prací na datových sadách, především vybudováním Databáze nářečních promluv pro odbornou veřejnost, jejíž naplnění reprezentativními audiozáznamy zajistí jeden z partnerů projektu, disponující největším interním archivem nahrávek tohoto druhu v ČR, (3) tvorbou několika softwarů, jmenovitě Automatického detektoru dialektu na základě audionahrávky, Rozpoznávače řeči adaptovaného pro generování dialektologické transkripce z audionahrávek a Multilingválního rozpoznávače západoslovanských jazyků pro generování folklorní transkripce z audionahrávek, (4) tvorbou tří specializovaných Map nářečních diferenčních hláskových jevů s interaktivními a multimediálními prvky, a především (5) tvorbou aplikace Jazyková paměť regionů České republiky. Ta bude otevřená široké veřejnosti pro komunitní doplňování, mapové zobrazování a poslech nářečních nahrávek. Publikační stránka projektu bude reprezentována odbornou knihou a řadou časopiseckých a konferenčních publikací.
Identifikační kód: DH23P03OVV010
Hlavní řešitel: Ing. Martin Karafiát, Ph.D., Fakulta informačních technologií Vysokého učení technického v Brně
Spoluřešitelé: Mgr. Marta Šimečková, Ph.D., Ústav pro jazyk český AV ČR; prof. RNDr. Vít Voženílek, CSc., Přírodovědecká fakulta Univerzity Palackého v Olomouci
Doba řešení: 2023–2027

LINDAT/CLARIAH-CZ – Digitální výzkumná infrastruktura pro jazykové technologie, umění a humanitní vědy
Ministerstvo školství, mládeže a tělovýchovy ČR
Anotace: Velká výzkumná infrastruktura LINDAT/CLARIAH-CZ představuje český národní uzel (distribuovaný mezi 17 zúčastněných partnerů z 15 institucí) panevropských výzkumných infrastruktur CLARIN-ERIC (Common Language Resources and Technology Infrastructure), DARIAH-ERIC (Digital Research Infrastructure for the Arts and Humanities) a EHRI-ERIC (European Holocaust Research Infrastructure, ve stádiu přípravy). LINDAT/CLARIAH-CZ shromažďuje, zpracovává, anotuje (manuálně i automaticky) a uchovává jazyková, multimediální a jiná data související s českým jazykovým prostředím, a to i z historického hlediska. Zároveň zprostředkovává otevřený přístup nejen k těmto datům, ale i k technologiím, relevantním zejména pro humanitní a společenské obory a související interdisciplinární výzkum (např. formální a počítačová lingvistika, translatologie, lexikografie, psychologie, sociologie, neurolingvistika, kognitivní vědy nebo umělá inteligence). V oblasti umění a humanitních oborů aplikujících digitální metody jde mj. o literaturu a literární vědy, historii včetně zdrojů orální historie a výzkumu holokaustu a genocid 20. století, historickou bibliografii, kulturu a vědu o kultuře, historii umění, filozofii, film a filmovou historii včetně nových médií a jejich analýzy, vizuální umění, muzikologii a historii hudby, etnologii, folklór, archeologii, egyptologii a interdisciplinární obory v jejich kombinaci, včetně kombinace s moderními technologiemi. LINDAT/CLARIAH-CZ se významně spolupodílí na vývoji datového repozitáře CLARIN DSpace, který poskytuje spolupracujícím organizacím na národní i mezinárodní úrovni. Hlavním cílem infrastruktury je zpřístupnit – v otevřeném režimu – digitalizované datové zdroje v uvedených oborech široké vědecké komunitě, a to včetně softwarových služeb nutných k efektivnímu využití těchto zdrojů. Součástí programu infrastruktury jsou také vzdělávací aktivity.
Registrační číslo: LM2023062
Řešitel: prof. RNDr. Jan Hajič, Dr., Matematicko-fyzikální fakulta Univerzity Karlovy
Spoluřešitel za ÚJČ: PhDr. Martin Prošek, Ph.D.
Doba řešení: 2023–2026

Historie češtiny v korpusovém kontinuu
Technologická agentura ČR – program SIGMA
Anotace: Cílem projektu HiČKoK je přispět k digitalizaci vzdělávání vytvořením datového, softwarového a znalostního zázemí pro studium češtiny v celém jejím historickém kontinuu (13.–21. století). Výsledkem implementace by mělo být vytvoření a zpřístupnění a) Monitorovacího korpusu (MKČ) pokrývajícího všechny etapy vývoje češtiny (viz příloha o složení korpusu) b) jazykových modelů ve schématu Universal Dependencies (UD), které umožní automatickou lingvistickou anotaci textů z libovolného období c) aplikace Timeline Maker umožňující zkoumat diachronní fenomény v MKČ d) online kurzu pro studenty a badatele pracující s historickými texty, který poskytne průpravu pro využití vytvořených výstupů a dalších relevantních technologií, které jsou dostupné v rámci projektového konsorcia.
Registrační číslo: TQ01000072
Hlavní řešitel: Mgr. Martin Stluka, Ph.D., Ústav Českého národního korpusu, Filozofická fakulta Univerzity Karlovy
Spoluřešitel za ÚJČ: PhDr. Jiří Pergler, Ph.D.
Doba řešení: 2023–2026

Víceslovné jednotky pro digitální vzdělávání
Technologická agentura ČR – program SIGMA
Registrační číslo: TQ01000177
Anotace: Projekt se zaměřuje na rozšíření lexikografické databáze víceslovných jednotek (VLJ) LEMUR, na její softwarové aplikační využití při korpusové anotaci a na uživatelské propojení databáze s jazykovými korpusy a se slovníkem. Hlavní parametry databáze byly vytvořeny v rámci projektu GA ČR GA16-07473S Mezi slovníkem a gramatikou. Na základě architektury i dat této databáze bude vytvořen nový software, který umožní identifikaci VLJ v korpusu. Korpusové doklady VLJ pak budou propojeny s odpovídajícími hesly Akademického slovníku současné češtiny (ASSČ) i s dalšími informacemi z lexikografické databáze. Propojení slovníku, korpusu a databáze umožní efektivně získat informace využitelné ve výuce češtiny od 2. stupně ZŠ až po VŠ studium bohemistiky i pro studenty s odlišným mateřským jazykem.
Hlavní řešitelka: PhDr. Marie Kopřivová, Ph.D., Ústav bohemistiky pro cizince a komunikace neslyšících, Filozofická fakulta Univerzity Karlovy
Spoluřešitel za ÚJČ: Mgr. Jan Křivan, Ph.D.
Doba řešení: 2023–2026