Razumijevanje značenja složenica:
kompozicionalnost utemeljena u jezičnom i vizualnom iskustvu
Marco Marelli
University of Milano-Bicocca
Od kad je nastala metoda latentne semantičke analize (Landauer i Dumais, 1997), u distribucijskoj se semantici razvijaju učinkoviti, podacima vođeni semantički modeli. U njima se značenje riječi prikazuje pomoću vektora kojima se bilježi supojavljivanje riječi u velikim tekstualnim korpusima. Međutim, opis semantičkog sustava u takvim je pristupima statičan, odnosno ne obuhvaća izrazito dinamične interakcije do kojih dolazi na značenjskoj razini tijekom jezične obrade.
U ovom ću izlaganju govoriti o modelu Compounding as Abstract Operations in Semantic Space (Slaganje kao apstraktna operacija u semantičkom prostoru; CAOSS), što je prvi korak od distribucijske semantike prema uključivanju značenja složenica (Marelli et al., 2017).
U modelu CAOSS, značenja riječi prikazuju se vektorima koji kodiraju supojavljivanje riječi u referentnom korpusu (npr. značenje riječi snijeg temeljit će se na tome koliko se često pojavljuje s drugim riječima), u skladu s načelima distribucijske semantike. Postupak slaganja rezultat je ponderiranog zbroja: na temelju dvaju vektora u i v (tj. sastavnica složenice), njihova složena reprezentacija (tj. sama složenica) može se izračunati kao c=M*u+H*v, gdje su M i H težinske matrice procijenjene na temelju korpusnih primjera. Te se matrice treniraju regresijom najmanjih kvadrata, gdje su ulazni podaci vektori sastavnica kao samostalnih riječi (npr. car ‘automobil’ i wash ‘prati’, rail ‘tračnica’ i way ‘put’), a izlazni podaci vektori primjera složenica (carwash ‘autopraonica’, railway ‘željeznica’), tako da se maksimizira sličnost između M*u+H*v i c. Drugim riječima, matrice se definiraju tako da se primjeri složenica rekreiraju čim je točnije moguće. Nakon procjene navedenih dviju težinskih matrica, one se mogu primijeniti na bilo koji par riječi kako bi se dobila reprezentacija značenja za kombinacije riječi koje nisu korištene pri treniranju modela (npr. snow building ‘građevina od snijega’).
U nizu bihevioralnih eksperimenata usporedili smo predikcije modela CAOSS s psiholingvističkim podacima. Pokazalo se da model reflektira psiholingvističke rezultate vezane uz obradu novih složenica (Marelli et al., 2017; Günther i Marelli, 2020), a posebice utjecaj relacijskih informacija (Gagné, 2001; Gagné i Shoben, 2007) te „efekt interferencije morfema“ (Crepaldi et al., 2010). Nadalje, CAOSS daje ključan doprinos razumijevanju značenjske prozirnosti poznatih složenica: procjene dobivene modelom najbolje objašnjavaju utjecaj prozirnosti na procesiranje riječi (Günther & Marelli, 2019). Najzad, CAOSS se ne može smatrati „neutjelovljenim modelom“, budući da ga je lako utemeljiti u percepciji tako da se u model, uz tekstualne podatke, uključe i slike (Günther et al., 2020).
Simulacije dobivene modelom CAOSS ukazuju na to da se znanje o složenicama može objasniti pomoću modela jezične statistike. Govornici o složenicama mogu naučiti iz jezičnog iskustva i svoja znanja automatski primijeniti na procesiranje bilo koje kombinacije riječi. Model CAOSS dovoljno je fleksibilan da simulira ovaj postupak, dođe do plauzibilnih predviđanja relacijskih sličnosti za nove složenice te da točno predvidi kako slaganje pridonosi semantičkoj prozirnosti. Model CAOSS omogućuje i generalizacije na druge vrste podataka, jer predviđa doprinos osjetilnog iskustva u internoj dinamici procesiranja riječi i složenica. Navedeno ukazuje na izravnu vezu jezičnog slaganja i konceptualnih kombinacija, što pokazuje da su u temelju obiju pojava opći procesi učenja.
Literatura
Crepaldi, D., Rastle, K. i Davis, C. J. (2010). Morphemes in their place: Evidence for position-specific identification of suffixes. Memory & cognition, 38(3), 312-321.
Gagné, C. L. (2001). Relation and lexical priming during the interpretation of noun–noun combinations. Journal of Experimental Psychology: Learning, Memory, and Cognition, 27(1), 236.
Gagné, C. L. i Shoben, E. J. (1997). Influence of thematic relations on the comprehension of modifier–noun combinations. Journal of Experimental Psychology: Learning, memory, and cognition, 23(1), 71.
Günther, F. i Marelli, M. (2019). Enter sandman: Compound processing and semantic transparency in a compositional perspective. Journal of Experimental Psychology: Learning, Memory, and Cognition, 45(10), 1872.
Günther, F. i Marelli, M. (2020). Trying to make it work: Compositional effects in the processing of compound “nonwords”. Quarterly Journal of Experimental Psychology, 73(7), 1082-1091.
Günther, F., Petilli, M. A. i Marelli, M. (2020). Semantic transparency is not invisibility: A computational model of perceptually-grounded conceptual combination in word processing. Journal of Memory and Language, 112, 104104.
Landauer, T. K. i Dumais, S. T. (1997). A solution to Plato’s problem: The latent semantic analysis theory of acquisition, induction, and representation of knowledge. Psychological review, 104(2), 211.
Marelli, M., Gagné, C. L. i Spalding, T. L. (2017). Compounding as Abstract Operation in Semantic Space: Investigating relational effects through a large-scale, data-driven computational model. Cognition, 166, 207-224.
227 total views, 1 views today
This post is also available in: English (Engleski)