Český národní korpus byl založen roku 1994 jazykovědcem a lexikografem Františkem Čermákem. Vytváří a spravuje jej Ústav Českého národního korpusu na Filozofické fakultě Univerzity Karlovy ve spolupráci s Matematicko-fyzikální fakultou či brněnskou Masarykovou univerzitou. První jazykový korpus na světě vznikl pro angličtinu na Brownově univerzitě v USA v 60. letech 20. století – u jeho zrodu navíc stál Čech Henry (Jindřich) Kučera, který z Československa emigroval po roce 1948. Postupně začaly vznikat korpusy i pro další jazyky a většina evropských jazyků dnes svůj jazykový korpus k dispozici má.
Český národní korpus patří v mezinárodním srovnání mezi špičku – co do objemu a rozmanitosti dat je nejbohatší ze všech slovanských jazyků a v obecném měřítku jej překonává zřejmě jen korpus německý. Český korpus obsahuje více než 3,6 miliardy slov českých a 1,5 miliardy jinojazyčných v kontrastu s češtinou. Jednotlivé korpusy jsou uzpůsobené k vyhledávání jak samostatných slov, tak i dílčích jazykových kategorií za pomoci regulárních výrazů, jimiž lze zadat kritéria pro různé slovní druhy či jiné formální znaky hledaných slov a slovních spojení. Jednotlivé korpusy totiž obsahují metadata o druhu zdrojového textu a jazykové značky pro různé kategorie. Jsou uzavřené, a tedy referenční, a umožňují tím replikovatelnost výzkumů. Na rozdíl od příruček ukazují jazykové jevy nikoli normativně, ale v autentickém kontextu – tak, jak byly v reálných textech skutečně užity, což poskytuje adekvátní představu o stavu jazyka. Kromě obecných jednojazyčných korpusů lze vyhledávat též v řadě specializovaných: korpusy mluveného jazyka, diachronní či autorské, dále např. korpusy nerodilých mluvčích češtiny či paralelní korpusy obsahující cizojazyčné a české verze téhož textu.
Český národní korpus nabízí široké využití pro jazykové profesionály od vědců přes překladatele a redaktory po novináře a učitele češtiny i cizích jazyků. Na jeho základě vznikají moderní mluvnice i slovníky, např. Mluvnice současné češtiny Václava Cvrčka či Akademický slovník současné češtiny Ústavu pro jazyk český Akademie věd České republiky.
2016-2020 ABCzech.cz - © Filozofická fakulta Univerzity Karlovy
Materiály dostupné na této platformě lze bez výslovného souhlasu užívat výhradně pro vlastní a nekomerční účely s řádným uvedením zdroje. Jakékoli jiné použití je povoleno pouze se souhlasem autorů.
Tato webová aplikace Sonic.cgi splňuje požadavky pro GDPR. Aktuální informace naleznete zde.