Využití korpusů

Publikace a závěrečné práce s analýzou našich dat

Chromá, Anna & Smolík, Filip. Can early use of be serve as a marker of grammatical development? Evidence from Czech longitudinal corpora. Odevzdáno v PLOS ONE. (Chroma v1.0)
Kohoutková, Jolana. Analýza slovosledu v korpusu spontánních konverzací matek s dětmi [https://dspace.cuni.cz/handle/20.500.11956/148107]. Nepublikovaná magisterská práce. FF UK. 2021. (LABELS2018)
Matějka, Štěpán. Pořadí osvojování gramatických slov a tvarů: elektronický dotazník. Nepublikovaná dizertační práce. FF UK. 2022. (Chroma v1.0)

Projekty zaměřené na analýzu našich dat

2021–2023 Nominal morphological categories and the mean length of utterance in a longitudinal corpus of early language development (č. START/HUM/016) financovaný Univerzitou Karlovou v rámci programu START; hl. řešitel: Klára Matiasovitsová (Chroma v1.0 a LABELS2018)

Klářin projekt získal podporu na dobu řešení od dubna 2021 do března 2023. Kromě Kláry byli/jsou členy řešitelského týmu Jakub Sláma, Kamila Homolková (do srpna 2021), Petra Čechová (od září 2021), Jolana Kohoutková (od října 2021) a Anna Chromá (od dubna 2022). Odborným konzultantem projektu je Filip Smolík. Celý tým se v rámci tohoto projektu věnuje dvěma výzkumným oblastem. Jednak to jsou vybraná měřítka obecné jazykové vyspělosti a jejich adaptace pro použití na českých (korpusových) datech; a jednak to je morfologická anotace Korpusů rané češtiny. Z měřítek jazykové vyspělosti se projekt věnuje různým způsobům měření průměrné délky výpovědi (ve slovech, slabikách a morfémech) a měřítku Index of productive syntax (Scarborough, H. S. (1990) a Altenberg, E. P., Roberts, J. A., & Scarborough, H. S. (2018)), který byl v rámci projektu adaptován na češtinu. K porovnání různých měřítek se využívá jak korpus LABELS2018, tak korpus Chroma v1.0. Dětské promluvy v korpusu Chroma v1.0 jsou morfologicky značkovány pomocí poloautomatické anotace (s využitím nástroje MorphoDiTa; Straka, M. & Straková, J., 2016).

2019–2023 Cross-methodological approaches to syntax and semantics (XMASS) financovaný FF UK v rámci programu PRIMUS; hl. řešitel: Radek Šimík
(Chroma v1.0 a LABELS2018)

Radkův projekt se zaměřuje na syntax a sémantiku wh-konstrukcí, a to z pohledu formálnělingvistického a mezijazykového, zároveň jsou zkoumána korpusová data a projekt zahrnuje i experimentální výzkum (podrobněji viz https://www.radeksimik.eu/minilab.html). Klára Matiasovitsová se v rámci něj věnuje osvojování wh-konstrukcí dětmi. Předpokladem je, že si děti budou osvojovat konstrukce v souladu s hierarchií: otázky > zanořené otázky > korelativa > vztažné věty bez hlavy / s lehkou hlavou > vztažné věty se jmennou hlavou. K ověřování této hypotézy využívá jak korpus Chroma v1.0, tak korpus LABELS2018. Zkoumá i souvislost mezi osvojováním wh-konstrukcí dětmi a frekvencí těchto konstrukcí v řeči orientované na dítě.