Marianna Bolognesi

Konkretnost i specifičnost: 

dvije varijable vezane uz apstrahiranje

Marianna Bolognesi

Riječi – gradivne jedinice jezika – mogu se shvatiti kao oznake kojima se određuju različite vrste kategorija. Nekim se riječima određuju kategorije konkretnih entiteta (mačke, stolovi), dok se drugima određuju kategorije apstraktnih entiteta (naslijeđe, empatija). Nekim se riječima određuju generičke kategorije koje se sastoje od mnogo različitih entiteta (vozila, umjetnost), dok se drugima određuju specifičniji entiteti (sportski automobili, impresionizam).

Kako bismo iz iskustva apstrahirali značenje, kako bismo razmišljali i komunicirali s drugim ljudima, koristimo se mehanizmima apstrahiranja pomoću kojih konstruiramo različite vrste kategorija. Konkretnost i specifičnost dvije su varijable koje nam omogućuju apstrahiranje iz osjetilnog iskustva koje je vezano uz „ovdje“ i „sada“. Sposobnost apstrahiranja svojstvena je ljudskoj spoznaji te je u temelju svake znanstvene, kulturne, tehničke i umjetničke djelatnosti.

Konkretnost se odnosi na razinu do koje se neka riječ odnosi na kategoriju koja je izvedena iz skupine entiteta koji se mogu percipirati pomoću osjetilnog iskustva. Tako se konkretna riječ pas odnosi na kategoriju entiteta koje možemo osjetilno iskusiti dodirom, dok to nije slučaj s apstraktnom riječi sumnja. Specifičnost se odnosi na to do koje je mjere značenje riječi precizno određeno: generičke kategorije poput riječi vozilo niske su specifičnosti i mogu se odnositi na mnogo različitih predmeta (automobili, kamioni, i sl.), dok su preciznije određene kategorije, poput kategorije traktor, veće specifičnosti i odnose se na manji broj pojedinih predmeta. 

Pri istraživanju mehanizama apstrahiranja kao i njezinih posljedica, istraživači iz različitih disciplina ponekad se bave samo specifičnošću ili samo konkretnošću. Na primjer, kognitivni se znanstvenici obično bave konkretnošću: oni istražuju mehanizme kojima se može objasniti konceptualno utemeljenje apstraktnih koncepata u osjetilnom iskustvu i djelovanju. Ti se mehanizmi zatim uspoređuju s mehanizmima koji objašnjavaju utemeljenje konkretnih koncepata u osjetilnom iskustvu i djelovanju. Nasuprot tome, računalni se znanstvenici obično bave ekstrakcijom kategorija na različitim razinama apstrakcije, što znači da se bave varijablom specifičnosti. Tako je ekstrakcija bila osnovni cilj u istraživanjima semantičkih mreža, tematskih modela, a u novije vrijeme i algoritama dubokog učenja.

Budući da se različite discipline bave različite aspektima apstrahiranja, dijalog između disciplina je otežan, što ugrožava razvoj teorije. Poteškoće proizlaze i iz toga što za konkretnost postoje baze ljudskih procjena koje se rutinski koriste u različitim disciplinama (npr. Brysbaert et al., 2014), dok za specifičnost takve baze ne postoje. Osim toga, neki istraživači intuitivno smatraju da konkretnost i specifičnost moraju visoko korelirati, a neki i da je riječ o međusobno zamjenjivim konceptima. To bi značilo da su konkretni koncepti (npr. banana) u prosjeku specifičniji od apstraktnih koncepata (npr. sloboda).

U ovom ću se izlaganju usredotočiti na razlike između konkretnosti i specifičnosti i njihov međuodnos. Prikazat ću rezultate velikog empirijskog istraživanja u kojem se specifičnost operacionalizira kao numerički rezultat (Bolognesi et al. 2020) te se automatski ekstrahira iz dostupne leksičke baze (WordNeta; Miller 1995) a zatim se korelira s ljudskim procjenama konkretnosti (Brysbaert et al., 2014). Premda rezultati pokazuju pozitivnu korelaciju, vidljivo je i da se dvije varijable odnose na različite pojave, jer riječi mogu biti konkretne i specifične (npr. aspirin, šal, propovjedaonica), konkretne i generičke (tvar, alat, konstrukcija), apstraktne i specifične (ratifikacija, Budizam, forenzika) te apstraktne i generičke (zakon, religija, ljepota). Zatim ću se pozabaviti nekim problemima vezanim uz WordNet – bazu koja je korištena za dobivanje podataka o specifičnosti – te ću prikazati preliminarne podatke ljudskih procjena specifičnosti koje smo prikupili za 1000 talijanskih riječi masovnim prikupljanjem podataka (crowdsourcing). Procjene su prikupljene pomoću zadatka rangiranja (metodom skaliranja razvijenom u Louviere et al., 2015), a ne klasičnim zadacima numeričkih procjena, jer klasični zadaci nisu najbolje prilagođeni za procjenu specifičnosti. U Louvierovoj metodi skaliranja najboljih i najlošijih primjeraka (engl. Best-Worst scaling method), u svakom se eksperimentu ispitanicima prikazuje popis četiriju riječi, a ispitanici trebaju odabrati koja je od riječi najspecifičnija a koja najmanje specifična. Ta se metoda nedavno pokazala posebno učinkovitom budući da su prikupljene procjene u odnosu na klasične zadatke imale veću valjanost predviđanja (Hollis i Westbury, 2018; Kahneman et al., 2021). Prikazat ću do koje mjere ljudske procjene specifičnosti riječi koreliraju s procjenama specifičnosti dobivenim automatski iz WordNeta te s ljudskim procjenama konkretnosti. Zatim ću raspravljati o teorijskim implikacijama rezultata te ću dati prijedloge za nova istraživanja, koja bi se mogla usmjeriti na sustavno prikupljanje procjena specifičnosti kako bi se došlo do sveobuhvatne teorije apstrahiranja.

 

Literatura

Bolognesi, M., Burgers, C. i Caselli, T. (2020). On Abstraction: Decoupling conceptual concreteness and categorical specificity. Cognitive Processing. 21, 365–381.

Brysbaert, M., Warriner, A.B., i Kuperman, V. (2014). Concreteness ratings for 40 thousand generally known English word lemmas. Behavior Research Methods, 46, 904-911.

Hollis, G., Westbury, C. (2018). When is best-worst best? A comparison of best-worst scaling, numeric estimation, and rating scales for collection of semantic norms. Behavior Research Methods 50, 115–133.

Kahneman, D., Sibony, O., Sunstein, C. R. (2021). Noise: A Flaw in Human Judgment. Little, Brown Spark.

Louviere, J., Flynn, T.N., i Marley, A. A. J. (2015). Best-Worst Scaling: theory, methods, and applications. Cambridge University Press.

Miller, G. (1995). WordNet: a lexical database for English. Commun. ACM 38, 11, 39–41.

 

 22 total views,  1 views today

This post is also available in: enEnglish (Engleski)