Kontekstualizacija smanjuje procjenu konkretnosti imenica
Anita Peti-Stantić, Mateusz-Milan Stanojević, Mirjana Tonković
U psiholingvističkim se radovima konkretnost obično procjenjuju tako da riječi stoje same, bez konteksta. Premda su tako dobivene procjene konkretnosti razmjerno stabilne i usporedive među jezicima, one imaju neke teorijske i metodološke nedostatke (v. Löhr 2021). Na primjer, nije jasno koje značenje riječi ispitanici procjenjuju ako je riječ o polisemima ili homonimima, a upitna je i ekološka valjanost procjena, jer se riječi u svakodnevnim situacijama ne koriste bez drugih riječi. Međutim, teško je pronaći ili konstruirati valjane kontekste jer se riječi razlikuju upravo prema tome kako se kombiniraju s drugima (v. Harris 1954). Drugim riječima, teško je pronaći prirodni kontekst koji će se moći koristiti za mnogo različitih riječi kako bi se osigurala njihova usporedivost kao i ekološka valjanost. U ovom smo izlaganju pokušali upravo to: bavimo se usporedbom konkretnosti za nekoliko skupina imenica kako bismo istražili razlikuju li se njihove procjene riječi izvan konteksta od procjene u kontekstu te može li se promjenom konkretnosti konteksta utjecati na procjenu konkretnosti riječi.
Istraživanje smo proveli na 24 imenice (po šest sa sufiksima –nik, –nje, –ost i –stvo). Te su skupine izabrane budući da se njihove procjene izvan konteksta u Hrvatskoj psiholingvističkoj bazi (HPB; Peti-Stantić i dr. 2019) znatno razlikuju: imenice na –nik (npr. učenik) u prosjeku su najkonkretnije, dok su imenice s drugim sufiksima (npr. nastojanje, darovitost, jedinstvo) apstraktnije. Ispitanici su imenice procjenjivali u predikativnoj pridjevskoj konstrukciji, a svaka se imenica javila u kombinaciji s po tri konkretna i apstraktna pridjeva (čija je konkretnost procijenjena iznad 3.5 za konkretne odnosno ispod 3.5 za apstraktne pridjeve u HPB-u). Na taj smo način dobili 144 kombinacije kao što su Prolaznik je malen i Prolaznik je neovisan. Te rečenice, uz 24 distraktora, procjenjivalo je 86 sudionika, studenata Sveučilišta u Zagrebu, preko platforme SurveyMonkey. Sudionici su dobili uputu da procjene prvu riječ u svakoj rečenici. Svaki je sudionik procijenio 48 rečenica, od čega je polovica bila distraktora. Svaku je imenicu na kraju procijenilo najmanje 42 sudionika u konkretnom i apstraktnom kontekstu.
Rezultati pokazuju glavni efekt skupine imenica te su usporedni s procjenama riječi izvan konteksta (imenice na –nik procijenjene su kao konkretnije). Javio se i glavni efekt vrste pridjeva (imenice su procijenjene konkretnijima uz konkretni pridjev), a interakcije između imenice i skupine pridjeva nije bilo. Najzad, postoji značajna razlika između procjena imenica izvan konteksta, u kombinaciji s konkretnim pridjevima i s apstraktnim pridjevima. Imenice izvan konteksta procijenjene su najkonkretnijima, a slijede ih kontekstualizirani primjeri s konkretnim pridjevima te kombinacije s apstraktnim pridjevima.
Ovi rezultati pokazuju da kontekstualizacija utječe na procjenu konkretnosti imenica, a konkretniji pridjevi dovode do viših procjena konkretnosti. Nadalje, procjene konkretnosti u kontekstu niže su nego kad se riječi ispituju same. Mogući razlog tome je da se kod procjenjivanja riječi izvan konteksta sudionici moraju osloniti na idealizirano znanje riječi, koje se temelji na konceptualnim i morfološkim obilježjima riječi (što dovodi do razlika u procjenama između skupina imenica s različitim sufiksima). Procjene u kontekstu primoravaju sudionike da u obzir manje uzimaju idealizirano znanje na račun pravog konteksta u kojoj se riječ javlja (čak i kada se od njih traži da procijene samo prvu riječ u rečenici), pa procjene budu niže nego izvan konteksta. Kontekstualizacija, čini se, veći naglasak stavlja na važnost distribucije riječi, koja nema toliku važnost kad se riječi procjenjuju izvan konteksta. Ta je pretpostavka u skladu s istraživanjem u kojem su se ljudske procjene konkretnosti uspoređivale sa strojno naučenima, gdje je računalni model – pretpostavlja se upravo zbog korištenja distribucijskih podataka – konzistentno procjenjivao konkretnost imenica kao nižu od ljudskih procjena (Peti-Stantić i ostali, 2021). To nas dovodi do sljedeće hipoteze koju tek valja ispitati: budući da se računalni model bazira na distribucijskim podacima, njegove su predikcije „manje idealizirane“ u odnosu na ljudske, a isto se događa i s kada se kontekstualni podaci daju ljudskim procjenjivačima.
Literatura
Harris, Zellig S. 1954. “Distributional Structure.” WORD 10 (2–3): 146–62. https://doi.org/10.1080/00437956.1954.11659520.
Löhr, Guido. 2021. “What Are Abstract Concepts? On Lexical Ambiguity and Concreteness Ratings.” Review of Philosophy and Psychology, March. https://doi.org/10.1007/s13164-021-00542-9.
Peti-Stantić, Anita, Mateusz-Milan Stanojević, Maja Anđel, Mirjana Tonković, Gordana Keresteš, Nikola Ljubešić, Jana Willer Gold, Jelena Tušek, Irina Masnikosa i Vedrana Gnjidić. 2019. “Hrvatska psiholingvistička baza.” Modeliranje mentalne gramatike hrvatskoga: ograničenja informacijske strukture. https://doi.org/10.17234/megahr.2019.hpb.
Peti-Stantić, Anita, Maja Anđel, Vedrana Gnjidić, Gordana Keresteš, Nikola Ljubešić, Irina Masnikosa, Mirjana Tonković, Jelena Tušek, Jana Willer-Gold, and Mateusz-Milan Stanojević. 2021. “The Croatian Psycholinguistic Database: Estimates for 6000 Nouns, Verbs, Adjectives and Adverbs.” Behavior Research Methods, April. https://doi.org/10.3758/s13428-020-01533-x.
118 total views, 2 views today
This post is also available in: English (Engleski)