HRVATSKA PSIHOLINGVISTIČKA BAZA

Dobrodošli u Hrvatsku psiholingvističku bazu – portal na kojem možete pretraživati ukupno 6000 riječi – 3000 iz korpusa hrvatskoga jezika, 1500 iz Hrvatskog čestotnog rječnika i 1500 iz udžbeničkih tekstova za četvrti, peti i šesti razred osnovne škole (Hrvatski jezik, Matematika, Povijest, Geografija, Priroda).

Riječi je moguće pretraživati na temelju objektivnih uvjeta kao što su vrsta riječi, duljina riječi, rod i živost imenica, čestoća riječi u internetskom korpusu hrvatskoga jezika hrWaC. Uz to, riječi je moguće pretraživati i na temelju uvjeta dobivenih psiholingvističkim istraživanjima. Ti su uvjeti konkretnost, predočivost, relativna čestoća i dob usvajanja.

Kako biste saznali koje su riječi do sada uvrštene u bazu, kliknite na sve riječi.

Baza se može pretraživati tako da tražite sve podatke koji vas zanimaju o pojedinoj riječi, ali i tako da se, uz pomoć dodatnih filtera, ograniči pretraživanje i usporede podaci za više riječi.

Ako želite pretražiti prvih 3000 dodanih riječi, u prvom padajućem izborniku odaberite “Baza riječi”, a zatim u treće polje upišite vrijednost “1“. 

Ako želite pretražiti drugih 3000 riječi, u prvom padajućem izborniku odaberite “Baza riječi”, a zatim u treće polje upišite vrijednost “2“.

Ako želite pretražiti svih 6000 riječi koje trenutno čine Hrvatsku psiholingvističku bazu, samo odaberite opciju “SVE RIJEČI”.

Baza riječi se može preuzeti na sljedećem linku.

Pretraži bazu

ili napravi upit


Hrvatska psiholingvistička baza nastala je i razvija se u sklopu projekta Hrvatske zaklade za znanost HRZZ-IP-2016-06-1210 MODELIRANJE MENTALNE GRAMATIKE HRVATSKOGA: OGRANIČENJA INFORMACIJSKE STRUKTURE koji vodi prof. dr. sc. Anita Peti-Stantić, a u čijem radu sudjeluju istraživači s Filozofskog fakulteta Sveučilišta u Zagrebu, kao i kolege s Instituta Jožef Stefan u Ljubljani i University College u Londonu.

Početna zbirka od 3000 riječi u Hrvatskoj psiholingvističkoj bazi sastoji se od po 1000 imenica, glagola i pridjeva hrvatskoga jezika iz flektivnog leksikona hrLex, čija je frekvencija očitana iz korpusa hrWaC. S obzirom na planirani opseg baze, ekscerpirani su samo leksemi koji se u korpusu pojavljuju češće od 3000 puta. Razlog takvom odabiru je procjena da ispitanici, budu li suočeni s leksemima koji su rijetki i čije im je značenje nepoznato, neće moći procijeniti ni njihovu konkretnost, ni predočivost. Takvom je metodom izdvojeno 7695 imenica, 2849 glagola i 3124 pridjeva. S tako dobivenih popisa slučajnim je izborom odabrano po 1000 leksema za svaku vrstu.

Za sve dodatne podatke možete se javiti na: anita.peti-stantic@ffzg.hr


Peti-Stantić, Anita et al. (2018). Hrvatska psiholingvistička baza (HPB). Projekt HRZZ-IP-2016-06-1210 Modeliranje mentalne gramatike hrvatskoga: ograničenja informacijske strukture.

Objavljeni znanstveni radovi vezani uz rad na Hrvatskoj psiholingvističkoj bazi:

Peti-Stantić, Anita, Maja Anđel, Gordana Keresteš, Nikola Ljubešić, Mateusz-Milan Stanojević, Mirjana Tonković (2018). Psiholingvističke mjere ispitivanja 3000 riječi hrvatskoga jezika: konkretnost i predočivost. Suvremena lingvistika.

Tušek, Jelena, Anita Peti-Stantić (2018). Što je predočivo, a što konkretno u hrvatskom? Zbornik Hrvatskoga društva za primijenjenu lingvistiku „Jezik i njegovi učinci“. Zagreb: HDPL i Srednja Europa.


Kontakt

prof. dr. sc. Anita Peti-Stantić
Odsjek za južnoslavenske jezike i književnosti
Filozofski fakultet Sveučilišta u Zagrebu
Lučićeva 3
10000 Zagreb
Tel. +385 (0)1 4092 275
E-mail: anita.peti-stantic@ffzg.hr

 2,460 total views,  2 views today

This post is also available in: enEnglish (Engleski)