> Fonologický korpus češtiny

Fonologický korpus češtiny

Fonologický korpus češtiny se skládá ze dvou částí, lexikálního subkorpusu a textového subkorpusu. První z nich je fonologicky a foneticky transkribovanou a anotovanou databází slovní zásoby současné češtiny. Obsahuje více než 275 000 lexikálních položek zaznamenaných v hlavních slovnících češtiny a je doplněn několika menšími databázemi mapujícími převážně propriální slovní zásobu. Textový subkorpus je fonologicky a foneticky transkribovaným přepisem 67 textů obsahujících více než 3,2 milionů slov.

Součástí webové stránky je kompletní kvantitativní fonologická analýza obou subkorpusů (frekvence fonémů, kombinací fonémů, slabičných typů atd.).