Viri, metode in orodja za razumevanje, prepoznavanje in razvrščanje različnih oblik družbeno nesprejemljivega diskurza v informacijski družbi
Čeprav pojav različnih oblik družbeno nesprejemljivega diskurza (DND), kot so sovražno, diskriminatorno in žaljivo izražanje, še zdaleč ni nov, se z njimi v zadnjem času zaradi številnih družbenih, kulturnih in ekonomskih sprememb izrazito intenzivno soočamo. Gre za izjemno širok in globalen družbeni problem, na katerega opozarjajo vse ključne mednarodne organizacije, kot so Svet Evrope, Evropska unija, Organizacija za varnost in sodelovanje v Evropi ter Združeni narodi. Kot dokazujejo redke doslej opravljene jezikoslovne raziskave sovražnega govora v Sloveniji (Červ in Kalin Golob 2012, Campos Fereira idr. 2012), problematika tovrstnih nesprejemljivih diskurzivnih praks močno presega okvire jezikoslovja, zato se lahko z njimi uspešno spopadamo le v sodelovanju s sociologi in pravniki. Ker pa je žaljivi in sovražni govor z razmahom informacijsko-komunikacijskih tehnologij in računalniško posredovane komunikacije (RPK) ter s hitrostjo širjenja informacij po internetu dobil povsem novo razsežnost, za učinkovito soočanje z njim v informacijski družbi hkrati nujno potrebujemo tudi avtomatiziran pristop.
Projekt je izrazito interdisciplinaren in povezuje strokovnjake s področja korpusnega jezikoslovja in sociolingvistike s strokovnjaki s področja kritične analize diskurza in družboslovnega anketiranja in pravne analize s strokovnjaki s področja jezikovnih tehnologij in strojnega učenja za slovenščino. Konzorcij sestavljajo naslednji projektni partnerji: Odsek za tehnologije znanja, Inštitut “Jožef Stefan” (IJS), Filozofska fakulteta, Univerza v Ljubljani (FF), Fakulteta za družbene vede, Univerza v Ljubljani (FDV), Mirovni inštitut.
Spletna stran: http://nl.ijs.si/frenk/
Izvedba
Delovni načrt je sestavljen iz treh vsebinskih delovnih sklopov:
- Prvi delovni sklop se posveča izgradnji korpusov, ki bodo omogočili empirične raziskave v projektu, in vključuje jezikoslovno obdelavo in obogatitev metapodatkov v korpusu.
- Drugi delovni sklop bo razvil tipologijo DND in njegovih tarč (skupine in posamezniki, proti katerim je DND usmerjen), v skladu s katero bo nato ročno označen reprezentativen vzorec DND, ki bo služil kot zlati standard za analizo DND. S pomočjo podatkovne zbirke in tehnik strojnega učenja bo razvita tudi avtomatska metoda za prepoznavanje in kategorizacijo DND ter njegovih tarč.
- Tretji delovni sklop vsebuje interdisciplinarne sociolingvistične analize, izvedene na zgrajenih jezikovnih virih z metodami korpusnega jezikoslovja, kritične analize diskurza, pravne analize in inferenčne statistike, ki jih dopolnjujejo tudi raziskave o dojemanju DND v slovenski družbi z metodo anketiranja.