Ciljevi i metode istraživanja

CILJEVI I METODE ISTRAŽIVANJA

Temeljni je cilj projekta Modeliranje mentalne gramatike hrvatskoga: ograničenja informacijske strukture uočiti, a potom i opisati korelacije između leksičkih i gramatičkih obrazaca kojima je određena mentalna gramatika informacijske strukture hrvatskoga jezika. Na temelju toga ćemo odrediti skup nužnih, univerzalnih kao i jezičnospecifičnih obrazaca koji određuju informacijsku strukturu hrvatskoga, na morfosintaktničkoj i na semantičkoj razini. Usredotočit ćemo se na lokalna (linearna) i globalna (hijerarhijska) ograničenja procesiranja u mentalnoj gramatici hrvatskoga (Peti-Stantić 2005, Pickering i Ferreira 2008).

Točnije, na temelju korpusnog i psiholingvističkog istraživanja odredit ćemo načine na koji govornici obrađuju morfosintaktičko i semantičko slaganje konkretnih i/ili apstraktnih jezičnih jedinica u koordiniranim konstrukcijama i elipsi, kao i načine na koje procesiraju informacijsku strukturu rečenice s obzirom na pomake skupine klitika.

Računalni je cilj projekta organizirati detaljno označenu i strukturiranu bazu podataka povezanu s korpusnim podacima koja će služiti kao preduvjet za uspješno modeliranje zadataka računalnog modeliranja.

Psiholingvistički analitički cilj je izgraditi repozitorij konstrukcijskih okvira na sučelje između sintakse i semantik s opisom okvira slaganja u rodu, elipsi i pomacima skupina klitika u hrvatskom. Ti su okviri utemeljeni na detaljnoj semantičkoj analizi u kojoj se uzima u obzir stupnjeviti karakter (engl. gradient) kategorija konkretnosti i predočivosti te njihova korelacija, kao i varijabilnost semantičkih reprezentacija triju istraživanih gramatičkih pojava. Pojave kojima se bavimo odabrane su zato što predstavljaju različite razine složenosti sintaktičko-semantičkoga sučelja te će stoga upravo opis tih pojava moći služiti kao temelj mreže gramatičkih obrazaca od kojih se sastoji mentalna gramatika hrvatskoga jezika.

Društveno relevantni cilj projekta je senzibiliziranje skupine profesora hrvatskoga jezika i njihovih učenika za važnost leksičkih i gramatičkih odnosa u mentalnoj gramatici hrvatskoga jezika na razvoj jezične kompetencije.

Teorijske posljedice navedenoga pristupa bit će vidljive u mogućnosti modeliranja razumijevanja na razini povezivanja globalnih i lokalnih gradivnih elemenata mentalne gramatike hrvatskoga. Na praktičnoj će razini projekt kroz promjenu kurikula hrvatskoga jezika pridonijeti poboljšanju produktivne jezične kompetencije u okvirima hrvatskog obrazovnog sustava.

Istraživanja provedena tijekom rada na projektu omogućit će daljnja istraživanja u nekoliko smjerova. Prvi je tipološka usporedba, isprva s drugim slavenskim jezicima, a zatim i s drugim jezicima svijeta. S tim u vezi smo uvjereni kako će rezultati naših istraživanja dugoročno omogućiti uspostavljanje mreže hijerarhijskih i linearnih ograničenja sintaktičke i semantičke strukture argumenata, kao i ograničenja informacijske strukture. Drugi je smjer uspostavljanje poveznica između rezultata semantičkih i gramatičkih veza s istraživanjima figurativnog jezika, posebice metafore i metonimije, što bi moglo imati posljedice za računalno modeliranje figurativnog jezika. Najzad, rezultati projekta bit će poticaj za primijenjenolingvistička istraživanja produktivne jezične kompetencije učenika različitih dobi, jer će osigurati osnovicu za daljnju analizu.

Predloženi projekt zamišljen je kao niz međusobno povezanih pojedinačnih kvantitativnih i kvalitativnih istraživanja utemeljenih na analizama korpusa, eksperimentalnom i korelacijskom pristupu. Sva ta istraživanja proizlaze iz krovne teme ispitivanja nužnih, univerzalnih i jezičnospecifičnih fenomena koji predstavljaju zahtjeve koji određuju potencijal slaganja u hrvatskom jeziku, kako na morfosintaktičkoj, tako i na dubinskim semantičkim razinama.

Kako bismo usmjerili pozornost na sučelje sintakse i semantike (eng. syntax-semantics interface), u projektu spajamo teorijski utemeljen introspektivni deduktivni pristup (od teorije prema podacima) s korpusno utemeljenim induktivnim pristupom (od podataka ka teoriji). Takva nam metoda omogućuje da usredotočimo pažnju na dva osnovna istraživačka problema: složenost sustavnih odnosa i prototipni karakter, odnosno varijabilnost konstrukcija (npr. Vranić i Tonković 2011; Peti-Stantić 2014; Peti-Stantić 2014a; Klubička i Ljubešić 2015).

Određivanje relacijskih obrazaca u leksičkoj i gramatičkoj domeni (na leksičkoj razini to je određivanje kategorija konkretnosti i predočivosti, a na gramatičkoj odnos slaganja, elipse i pomaka u redu riječi) bit će utemeljeno na kvantitativnoj statističkoj te na kvalitativnoj psiholingvističkoj analizi. Komplementarnost pristupa omogućit će analizu i opis pojava kojima se bavimo na različitim razinama detaljnosti te uspostavljanje korelacije između njih.

Intuicije ispitanika koji su sudjelovali u ispitivanju prilikom istraživanja semantičke kategorije konkretnosti bit će ugrađene u računalni sustav. To će nam omogućiti uspostavljanje polu-automatiziranog sustava zasnovanog na relevantnim ograničenjima prirodnoga jezika (Agić i Ljubešić 2014).

Priprema eksperimenta i predistraživanje: Svi suradnici u istraživačkoj skupini pod vodstvom M. Tonković i G. Keresteš sudjelovat će u određivanju provedivog dizajna istraživanja (faktorski dizajn, latinski kvadrat itd.), u oblikovanju i odabiru eksperimentalnim podražajnih materijala uvjetovanih tipom zadataka (potaknuta produkcija, čitanje vlastitim tempom, RSVP, zadaci leksičke odluke na temelju ciljane riječi i ne-riječi, zadaci sintaktičke klasifikacije i dr.), kao i u odabiru načina provedbe eksperimenta (produkcija, pisanje, procjena gramatičnosti). Isto će tako sudjelovati u procjeni potrebnoga broja ispitanika kako bi odabrani dizajn bio provediv i omogućio oblikovanje relevantnih statističkih zaključaka. Zadaci će se prema potrebi prilagođavati različitim dobnim skupinama.

Prva faza je korpusno istraživanje, gdje će se iz korpusa hrWaC (trenutno 1.9 milijarda riječi), a uz pomoć flektivnog leksikona hrLeX, ekscerpirati 3000 visoko i nisko frekventnih imenica, glagola i pridjeva. Korpus hrWaC se koristi zašto što je riječ o korpusu koji zbog svojih specifičnosti (veličina, suvremenost, nelektorirani tekstovi) može poslužiti kao dobar izvor za modeliranje i ekscepiranje podataka. Nadalje, iz korpusa hrWaC ekscerpirat će se i sve moguće kombinacije glagolskih i zamjeničkih klitika zajedno s frekvencijskim podacima.

U drugoj fazi slijedi uređivanje navedenih popisa leksičkih i gramatičkih jedinica i njihova podjela u odgovarajuće skupove te priprema za psiholingvističke eksperimente i upitnike.

Treća faza je usmjerena na izradu upitnika i provođenje eksperimenata prvo na odrasloj, a zatim na školskoj populaciji. Istraživanja će obuhvatiti zadatke procjene konkretnosti i predočivosti pojmova i produkcije (slaganje u rodu, elipa i red riječi) te procjenu gramatičnosti, procjenu razumijevanja i tzv. priming (elipsa, uvrštavanje klitika). Bit će provedeni i intervjui s nastavnicima i učenicima. Cilj tih intervjua pripremljeni na temelju rezultata lingvističkih istraživanja je prikupljanje kvalitativnih podataka vezanih uz razumijevanje profesora i učenika u vezi s mogućim teškoćama prilikom korištenja apstraktnog i konkretnog leksika te prilikom slaganja, razumijevanja elipse i pomaka u informacijskoj strukturi koji proizlaze iz uvrštavanja klitika u rečenici.

U četvrtoj fazi će, na temelju navedenih rezultata, ista klasifikacija biti simulirana umjetnom neuronskom mrežom u uvjetima nadziranog učenja. Takav pristup omogućuje modeliranje parametara mentalne gramatike.

Peta faza sastojat će se od psiholingvističkog modeliranja prikupljenih rezultata u okviru teorije paralelne arhitekture.

Nakon provođenja eksperimenta/analiza podataka: Svi će članovi projekta, ovisno o svojim području stručnosti, sudjelovati u interpretaciji rezultata. Cilj je prikupljene podatke iskoristiti za kvalitativnu i kvantitativnu analizu koja će predstavljati osnovicu lako pretraživog i dostupnog skupa obrazaca koji će se potom moći koristiti kao podaci u daljnjim eksperimentima ili u prezentacijama projekta. Na temelju tih analitičkih rezultata projektni će tim razviti hipoteze koje će, koristeći sofisticirane statističke analize (npr. mješoviti logit model, Bayesova statistika), omogućiti dublje uvide u prikupljene podatke i pružiti točnije informacije o procesiranju

U nastavku detaljno opisujemo metodološke postupke vezane uz središnju, treću fazu, budući da ona sadrži metodološki najsloženiji dio projekta zato što je neposredno povezana uz rad s ispitanicima (odraslima i učenicima).

Uzorak

U istraživanju će sudjelovati dvije skupine ispitanika. Jedna se skupina sastoji od zdravih izvornih govornika hrvatskoga jezika (uglavnom studentska populacija). Druga se skupina sastoji od tri podskupine učenika osnovnih i srednjih škola (4. razred osnovne škole, 7. ili 8. razred osnovne škole i 3. razred srednje škole). Skupine su odabrane na osnovi dosadašnjih istraživanja koja ukazuju na razlike između mentalnih gramatika govornika istoga jezika koji pripadaju različitim društvenim i dobnim skupinama (Dąbrowska, 2012). Ta istraživanja posebno ističu kako je dio razlika, i to upravo onaj koji se tiče mogućnosti reproduktivnoga i produktivnoga služenja složenim morfosintaktičkim i leksičkim strukturama, kvantitativno i kvalitativno uvjetovan obrazovanjem. Uz to, istraživanja pokazuju kako postoji bitna razlika u sposobnosti usvajanja osnovnih leksičkih i gramatičkih obrazaca nekog jezika i složenih obrazaca čije se usvajanje tijekom obrazovnog procesa potiče nizom međusobno povezanih postupaka osvješćivanja, prije svega semantičkih leksičkih mreža kojima se istovremeno proširuje i produbljuje mentalni leksikon pojedinca. Uz to, skupine su, posebno učeničke populacije, isto tako odabrane s ciljem utvrđivanja ključnoga trenutka u obrazovnom procesu u kojem je razvojno i obrazovno nužno promijeniti pristup i s reproduktivnog usvajanja gramatičkih načela prijeći na produktivno usvajanje obrazaca u kontekstu.

Postupci

Kvantitativna istraživanja provodit će se putem papira i olovke i online, ovisno o cilju pojedinog istraživanja i planiramom uzorku ispitanika. Eksperimentalna istraživanja uključivat će zadatke leksičke ili semantičke odluke, dovršavanja rečenica, klasifikacije, prepoznavanja, dosjećanja i procjenjivanja. Ispitanici će odgovore davati na uređaju za precizno mjerenje vremena reakcije, tipkovnici ili usmeno. Istraživanja koja se budu provodila putem papira i olovke uključivat će zadatke procjene apstraktnosti i predočivosti pojmova, a od ispitanika će se tražiti procjene na ljestvicama Likertova tipa. Osim toga, istraživanja će uključivati i zadatke za procjenu razumijevanja pročitanog.

Kvalitativna istraživanja provodit će se uz pomoć ciljanih intervjua s nastavnicima i učenicima.

Analiza podataka provodit će se u računalnom programu SPSS ili javno dostupnom programu JASP za statističku obradu podataka.

Metodološka inovativnost istraživanja prije svega se ogleda u povezivanju teorijski informiranog kvalitativnog i kvantitativnog psiholingvistički utemeljenog istraživanja koje će omogućiti uspostavljanje prediktivne leksičke analize na razini korpusa, kao i na razini gramatičkih obrazaca mentalne gramatike. Na taj se način uspostavlja sasvim nova veza između leksičke i gramatičke sastavnice jezika te se otvara put prema razumijevanju dubinskih odnosa koji proizlaze iz sagledavanja jezične strukture u kojoj leksičko i gramatičko ne stoje na odvojenim, suprotstavljenim stranama, nego su međusobno ovisni na razinama koje se do sada nisu istraživale, posebno u hrvatskom jeziku. Zbog specifičnosti i iznimne razvedenosti morfološke i sintaktičke strukture hrvatskoga jezika, tijekom istraživanja će biti moguće ispitati suodnose između pretpostavljenih univerzalnih leksičkih obilježja (kao što su apstraktnost i konkretnost) i specifičnih gramatičkih obilježja hrvatskoga jezika (kao što su sintaktičko slaganje raznorodnih koordiniranih struktura u rodu, semantičko slaganje uz izostavljanje zamjenica u diskursu i utjecaj pomaka u redu riječi na informacijsku strukturu rečenice). Takvi će postupci s jedne strane dovesti do novih spoznaja koje će informirati teorijsku lingvistiku te hrvatski jezik postaviti kao relevantnu točku na lingvističku kartu svijeta, a s druge će strane omogućiti uspostavljanje baze podataka specifičnih leksičko-gramatičkih problema vezanih uz hrvatski jezik koja će se moći koristiti kao osnovica za poboljšanje obrazovanja na materinjem jeziku, prije svega dubinskoga čitanja i razumijevanja pročitanog.

Izvedivost studije i upravljanje mogućim rizicima. Dosadašnja pojedinačna iskustva suradnika na projektu, kao i iskustva rada u timovima, posebno iskustva voditeljice projekta koja je višekratno sudjelovala u psiholingvističkim i sociolingvističkim istraživanjima i s odraslima i s nastavnicima i učenicima u osnovnim i srednjim školama diljem Republike Hrvatske, od kojih je većinu istraživanja i samostalno vodila, kvalificiraju istraživače za provedbu ovako zahtjevnoga niza psiholingvističkih istraživanja u okviru kojih se prije svega ispituju ograničenja informacijske strukture i suodnos dubinskih leksičkih gramatičkih odnosa. Jedan od mogućih rizika predstavlja potreba za dobrom organizacijom svih faza istraživanja kako bi se ostvarili zacrtani ciljevi. To će se postići detaljno razrađenim planom (vidi tablicu s radnim planom) i redovitim šestomjesečnim (a po potrebi i češćim) praćenjem provođenja projektnih zadataka te potrebnim prilagodbama. Uz to, svaki će segment istraživanja voditi jedan istraživač, a voditeljica će koordinirati rad na čitavom projektu. Mogući dodatni, premda minimalni rizici, proizlaze iz potrebe za dobrom organizacijom istraživanja tako da se njime obuhvati reprezentativni uzorak studenata i učenika iz različitih krajeva u Republici Hrvatskoj. S obzirom na to da je voditeljica projekta u više navrata organizirala i provodila sociolingvistička i psiholingvistička istraživanja te da je sudjelovala u izradi prijedloga dokumenta jezično-komunikacijskoga područja unutar Cjelovite kurikularne reforme Republike Hrvatske, kontakti stečeni u tim poslovima pomoći će joj da pronađe dovoljan broj škola zainteresiranih za sudjelovanje. Suradnica na projektu Gordana Keresteš isto je tako u posljednjih osam godina vodila hrvatski dio dvaju međunarodnih znanstvenih projekata vezanih uz početno čitanje i u tu je svrhu razvila suradnju s nekoliko osnovnih škola u Gradu Zagrebu i Zagrebačkoj županiji, tako da smatramo da ćemo bez većih problema pronaći dovoljan broj zainteresiranih za provođenje relevantnog i kontroliranog niza psiholingvističkih istraživanja. S tim će u vezi tijekom prve i druge godine rada na projektu znatan dio vremena bit će posvećen uspostavljanju kontakata sa profesorima zainteresiranima za istraživanje te pribavljanje potrebne dokumentacije kako bi se istraživanje moglo provesti uz poštivanje svih etičkih načela. Istraživači na projektu smatraju da je prilikom svakog istraživanja, a posebno kad je riječ o istraživanju fenomena unutar materinjeg jezika s učenicima i studentima, potrebno uspostaviti partnerski odnos i s pojedincima koji sudjeluju u istraživanju, ali i s predstavnicima nadležnih institucija, jer se samo tako može osigurati da sudionici budu zainteresirani i za samo istraživanje, ali i za njegove rezultate i za eventualna poboljšanja do kojih razvijeni alati mogu dovesti u nastavnom procesu.

Premda smo svjesni mogućega rizika vezanoga uz percepciju ravnatelja i/ili profesora da će istraživanje dodatno opteretiti vrijeme predviđeno za nastavu koje je ionako ograničeno, nadamo se da će pozitivna atmosfera stvorena na aktivima učitelja i profesora diljem Republike Hrvatske vezana uz predstavljanje Cjelovite kurikularne reforme, kao i svijest o relativno slabim rezultatima naših učenika na PISA testovima i o potrebi za poboljšanjem rada vezanoga uz jezično-komunikacijsku kompetenciju, doprinijeti njihovoj spremnosti za uključivanje u istraživanje.