Nyelvtechnológiai eszközök és eljárások alkalmazhatósága autizmusban
Abstract
Az autizmuskutatások utóbbi évtizedekben intenzíven növekvő száma és ezzel összefüggésben az autizmus egyre árnyaltabb megismerése és megértése mind a diagnosztika, mind a támogatás terén egyre szofisztikáltabb eszközök, eljárások és módszertan kidolgozását, rendelkezésre állását teszi lehetővé. A nyelvtechnológiai kutatások, a természetesnyelv-feldolgozás robbanásszerű fejlődése kitágítja az eszközök és eljárások alkalmazhatóságának körét: nemcsak a neurodivergens emberek nyelvhasználati sajátosságainak gépi feltárásában, hanem a diagnosztikában és a személyek támogatásában játszott lehetséges szerepe is hangsúlyosabbá válik. Éppen ezért dolgozatomban ismertetek egy szisztematikus áttekintést, amelynek fókuszában a nyelvtechnológiai eljárások és eszközök autizmussal összefüggő nyelvi sajátosságok feltárására irányuló alkalmazása áll, valamint egy, a nemzetközi kutatásokhoz leginkább illeszkedő szógyakorisági alapú gépi elemzés eredményeit, valamint az azt kiegészítő esettanulmány jellegű kézi elemzést.
Az autizmussal kapcsolatos szakirodalom tanulmányozásakor még mindig megfigyelhető, hogy a kutatások fókuszában jellemzően a gyermekek, valamint a szóbeli megnyilatkozások vizsgálata, tanulmányozása áll. Épp ezért dolgozatomban elsősorban felnőtt írott nyelvi produktumok elemzését valósítottam meg gépi és kézi formában. Az autizmusban főként a társas és a kommunikációs területen jelenlévő minőségi eltérésekkel, a reciprocitásban tetten érhető nehézségekkel, valamint a mindezek hátterében álló vezető kognitív magyarázatokkal (naiv tudatelmélet, végrehajtó funkciók, gyenge centrális koherencia) összhangban az elemzésem tárgyát az affektivitással, az értékeléssel és a kognícióval kapcsolatos szavak előfordulási gyakoriságának vizsgálata képezte különböző véleményalkotási és történetírási feladatokban. A kontrollcsoportos vizsgálatom fókuszában tehát az autizmussal élő felnőtt személyek írásbeli nyelvhasználatában megfigyelhető lehetséges megkülönböztető szerepű, interindividuális eltéréseinek és csoportsajátosságainak az azonosítása áll egy specifikus nyelvtechnológiai eszköz, a NarrCat alkalmazásával. Specifikusabban arra voltam kíváncsi, hogy a vizsgálati, azaz az autizmussal élő és a kontroll csoport esetében magyar nyelvű adatközlőknél megjelennek-e a szisztematikus áttekintés és a további szakirodalmi kutatómunka során azonosított nemzetközi (döntően angol nyelvű) tanulmányok adataiban található eltérések: az értékelő (szentiment), az affektív és a kognícióval kapcsolatos szavak alacsonyabb előfordulási aránya. Az értékeléssel (szentimentek), affektivitással (érzelmek) és kognícióval kapcsolatos szógyakoriság alapú nyelvhasználati, nyelvi különbségek gépi elemzéssel nyert adatainak statisztikai elemzése nem tárt fel szignifikáns különbséget a két csoport megnyilatkozásaiban. Azt, hogy a csoportok között nem mutatkozott szignifikáns különbség, számos tényező magyarázhatja, így például módszertani kérdések, mint az eltérő modalitás (szóbeli vs. írásbeli nyelvhasználat), az adatgyűjtéshez alkalmazott eljárás (online kérdőív vs. ADOS-aktivitások), életkori és az azzal szervesen összefüggő tapasztalatok eltérése, a feladat típusa. A gépi elemzést esettanulmány jellegű kézi elemzéssel is kiegészítettem, amelynek célja kettős volt: egyrészt a csoportkülönbségek hiánya mögötti lehetséges további magyarázatok feltárásának igénye, másrészt a gépi elemzéssel kapcsolatos módszertani kérdések megfogalmazása. A véletlenszerűen kiválasztott szövegeken végzett manuális vak kódolás öt független annotáló segítségével történt. Az eredmények alapján egyértelműen látszik, hogy az alkalmazás előtt érdemes megismerni a nyelvtechnológiai rendszer hátterében működő eljárást, algoritmusokat és esetleg szótárakat, valamint a gépi elemzést célszerű véletlenszerűen kiválasztott szövegek kézi elemzésével kiegészíteni az alkalmazott eszköz felülvizsgálata és a módszer problémaspecifikus alakítása miatt a pontosság érdekében. A gépi elemzés egyik autizmussal kapcsolatos specifikus problémája lehet a sajátos jelentéstartalmú szavak, neologizmusok és idioszinkráziák kezelésének implementálása, hiszen az autizmussal élő személyek nyelvhasználatában gyakorta megjelenhetnek. A kézi elemzésre vonatkozó módszertani megfontolások szempontjából az affektív és szentiment tartalmak azonosításakor kiemelt figyelmet kell fordítani a kontextushatásra és a személyes tapasztalatokon alapuló érzelmi töltet mentén történő azonosításra, valamint az annotálók közötti egyetértés vizsgálatára. A szisztematikus szakirodalmi áttekintés és a kutatás eredményeit alapul véve fogalmazok meg megfontolásokat és észrevételeket azzal kapcsolatban, hogy a nyelvtechnológiai eszközök, eljárások az autizmussal élő személyek nyelvhasználati sajátosságainak vizsgálatában milyen feltételekkel alkalmazhatóak, valamint milyen módszertani problémák merülhetnek fel ezen a területen.