"Sporazumevanje v slovenskem jeziku" English English

Referenčni korpus in leksikalna baza slovenskega jezika s slovničnim analizatorjem

Cilj tega sklopa je izdelava:
referenčnega korpusa v obsegu več 100 milijonov besed, ki bo vključeval tudi govorni podkorpus;
leksikalne baze slovenskega jezika, ki bo vsebovala podatke o lastnostih elementov besedišča, kot so pogostost pojavljanja besede, izgovorjava, pomenska struktura, frazeologija itd.;
slovničnega analizatorja, ki vključuje oblikoslovni leksikon in orodje za avtomatsko oblikoslovno in skladenjsko analizo besedil v slovenskem jeziku.
MŠŠ EU