"Sporazumevanje v slovenskem jeziku" English English

Učni korpus

cilj aktivnosti je ročno označeni oz. preverjeni učni korpus, namenjen učenju statističnih modelov označevalnikov in razčlenjevalnikov
korpusu bo vseboval štiri ravni označevanja
informacijo o besedni lemi
oblikoslovne oznake
skladenjsko razčlenitev
prepoznavo lastnih imen
obsegal bo 400.000 besed
določanje standardov za izdelavo učnega korpusa poteka od junija 2008 do decembra 2008
označevanje učnega korpusa bo potekalo od januarja 2009 do decembra 2010

Vodja aktivnosti: dr. Simon Krek, Amebis, d.o.o., Institut Jožef Stefan

MŠŠ EU