Korpuszépítéstől a tananyagfejlesztésig – Korpusznyelvészeti vizsgálatok és az eredmények felhasználása egy gyermekeknek szóló tananyagban
Abstract
A jelen doktori értekezésben bemutatott korpuszalapú kutatás célja a magyar anyanyelvű, 11–15 éves adatközlő gyermekek természetes nyelvhasználatának megfigyelése és elemzése, az eredmények felhasználásával pedig egy korpuszinformált magyar mint idegen nyelvi tananyag készítése. A kutatás során a gyermekek spontán beszédében megjelenő, a nyelvtanulás szempontjából is hasznos formulaszerű lexikai egységek feltérképezésére és használati mintázatainak megismerésére került sor. Az anyanyelvi beszélők nyelvhasználatában gyakran megjelenő formulaszerű egységek alapvető fontosságúak a nyelvfeldolgozás és a nyelvi produkció szempontjából is. Megfelelő használatuk fejleszti a nyelvtanulóknak mind a produktív (beszéd- és íráskészség) mind a receptív készségeit (olvasás, beszédértés), mivel a gyakran ismétlődő lexikai egységek felismerése és memorizálása – többek között – lehetővé teszi beszéd közben a memóriából történő gyorsabb előhívást, valamint a nyelvi input gyorsabb feldolgozását.
A kutatást a KorSzak Gyermeknyelvi Korpuszra alapoztuk, amely kifejezetten olyan korpusznyelvészeti kutatások céljából jött létre és épül 2020 óta, amelyek eredményeinek felhasználásával gyermekek számára szóló tananyag készülhet, ezért a korpuszépítés folyamatának bemutatása is fontos részét képezi az értekezésnek. A KorSzak Gyermeknyelvi Korpuszban szereplő szövegek összeállítása tudatosan történt a tananyagkészítést mint elsődleges célt szem előtt tartva. A korpuszépítés tervezésekor kizárólag a témák meghatározására került sor, amely nem befolyásolta a beszélgetések során a gyermekek által használt nyelvi eszközöket, így a természetes nyelvhasználat jól megfigyelhető benne. A témák kiválasztása pedig a gyermekek bevonásával történt.
A kutatás egy magyarázó szekvenciális tipológia alapján folyt, amely során a kvantitatív vizsgálatokat kvalitatív elemzések követték. A Sketch Engine, valamint a Praat szoftver segítségével készült korpuszalapú vizsgálat több szekvenciából tevődött össze, amelyek alapvetően minden alkalommal vagy az egyelemű lexémákból, vagy a két- és többelemű lexikai egységekből indultak ki. Az előre meghatározott feltételrendszer alapján az egyelemű lexémák közül az első száz legnagyobb gyakorisági mutatóval rendelkező került kiválasztásra. A többelemű lexikai egységek közül pedig összesen kétszázat vizsgáltunk meg, a gyermekek beszédében megjelenő kételemű, háromelemű, valamint négyelemű lexikai egységekre koncentrálva. Egyes, a nyelvtanulás szempontjából is hasznos, nagy gyakorisági mutatókkal rendelkező lexikai egységek használati mintázatával bővebben is foglalkoztunk (például nem is tudom, mit tudom én, én is így vagyok ezzel/vele), valamint a többelemű lexikai egységeket a szövegben betöltött szerepük szerint csoportosítottuk. Az így kapott eredményeket felhasználtuk a tananyag elkészült fejezeteiben.
Az értekezés végén sor kerül a Magyar felfedező című tananyag felépítésének és módszertani jellemzőinek példákkal illusztrál bemutatására, amelyben arra is kitértünk, hogy a KorSzak Gyermeknyelvi Korpusz hogyan járult hozzá a tananyagkészítéshez.