Hledáme pro nové nahrávání rodinu s jedním prvorozeným dítětem (ideálně holčičkou) mezi 12 až 24 měsíci, které aktuálně už používá nějaká slova, ale není jich moc a ještě je nekombinuje (popř. ještě ani žádná nepoužívá, ale rodina by byla v pravý čas ochotná začít nahrávat). Máte-li zájem se do našeho nahrávání zapojit, ozvěte se nám!
Půjčujeme do rodin kamery a diktafony a necháváme nahrávat komunikaci malých dětí s jejich rodiči.
V každé rodině necháváme nahrávat dlouhodobě v pravidelných intervalech a získáváme tak obrázek o jazykovém vývoji daného dítěte, ale i o tom, jak na něj mluví dospělí.
Nahrávky přepisujeme a přepisy anonymizujeme. Děti pak mají v přepisech pseudonymy a další citlivé údaje se odstraňují nebo nahrazují pseudoúdaji.
Anonymní přepisy zveřejňujeme, aby je mohl analyzovat každý, kdo má zájem. Sami dál pracujeme na novějších verzích korpusů (např. s morfologickou anotací) i na jejich analýzách.
Pro přepis používáme systém CHAT, standardní formát přepisu mluvené komunikace vyvinutý speciálně pro potřeby přepisu dětské řeči, publikovaný poprvé v roce 1990 a od té doby pravidelně a často aktualizovaný (MacWhinney, 2000). Manuál CHATu je velice obsáhlý a je přímo určený k tomu, aby si z něj každý výzkumník vybral jen ty prvky, které potřebuje pro svůj záměr. Při přepisu pro Korpusy rané češtiny tak pracujeme s vlastní verzí Manuálu /link – pdf?/ a speciálně se zaměřujeme na anotaci (1) dysfluencí v řeči (opakování, falešných začátků, sebeoprav), (2) citoslovcí, (3) morfologických inovací, (4) chyb a (5) dětských forem. Používáme také několik vlastních kódů v nadstavbě nad základním systémem CHATu, a to kódy pro speciální užití citoslovcí ve funkci predikátu (uděláš ham?), v nominální funkci (podívej, támhle je hafhaf.) a v atributivní funkci (pozor, ta pánev je auau!). Tyto jmenované jevy tedy v přepisu anotuje ručně přímo přepisující. Lemmatizace a další morfologická anotace korpusů není úkolem přepisujících; vyžaduje mnoho další práce a její vytvoření je momentálně hlavní náplní projektu START.
Každou nahrávku vždy přepíše jedna vyškolená osoba a předá ji druhé osobě ke kontrole. Zkontrolovaná verze se vrací zpět k původnímu přepisujícímu, který ji znovu přečte, dočistí a vytvoří finální verzi. Na závěr projde přepis formální automatickou kontrolou v programu CLAN, který si rozumí s formátem CHAT a má pro tento účel speciální funkci.
Reference:
MacWhinney, B. (2000). The CHILDES project: Tools for analyzing talk. 3rd edition. Mahwah, NJ: Lawrence Erlbaum Associates.
Jádro týmu Korpusů rané češtiny tvoří koordinátorky, doktorandky FF UK, Anna Chromá a Klára Matiasovitsová. V pozici zkušenějšího konzultanta figuruje od počátku projektu docent Filip Smolík. V klíčové oblasti přepisu a revizí se projekt aktuálně může opřít o tři zkušené a dlouhodobě spolupracující pregraduální studentky FF UK Markétu Baslovou, Terezu Šátavovou a Kateřinu Šimkovou; a tři šikovné nováčky rovněž z řad studujících na FF UK (zaškolené na začátku roku 2022), Štěpánku Tvrdíkovou, Jana Pince a Leonu Strakovou. Mezi přepisující do nedávna patřila i doktorandka FF UK Jolana Kohoutková, která se momentálně věnuje pouze omezeně revidování a jinak je spoluřešitelkou Klářina projektu START. Spoluřešiteli tohoto projektu jsou i doktorandi FF UK Jakub Sláma a Petra Čechová.