Par CLARIN projektu
CLARIN ir Eiropas valstu sadarbības iniciatīva, kuras mērķis ir novērst pašreizējo sadrumstalotību valodas resursu jomā un izveidot integrētu, paplašināmu un sadarbību veicinošu pētniecības infrastruktūru, kas ļautu viegli piekļūt un izmantot valodas resursus un tehnoloģijas ne tikai dažādu humanitāro un sociālo zinātņu nozaru pētniekiem, bet arī humanitāro un eksakto zinātņu starpnozarei datorlingvistikai. Valodnieki, izmantojot digitālu, formāli anotētu valodu materiālu, varēs izstrādāt un optimizēt valodas analīzes modeļus un rīkus. Humanitāro zinātņu pētnieki varēs efektīvi izmantot darbam nepieciešamos resursus un tehnoloģijas. CLARIN iniciatīvas sagatavošanas posms tiek īstenots ar 7. pamatprogrammas projekta CLARIN finansiālu atbalstu. Projektā ir 35 partneri. No Latvijas CLARIN projekta partneris ir LU Matemātikas un informātikas institūts.
Valoda, tās resursi un tehnoloģijas
Eiropa ir multilingvāla, un, lai risinātu dažādas ar (daudz-)valodu automatizētu analīzi saistītas problēmas, ir jāizveido lieli, balansēti tekstu korpusi kā vienvalodu, tā arī paralēlie (sastatīti viens no otra tulkoti teksti) un leksiskas datubāzes (izsmeļošas, formāli precīzas skaidrojošās un tulkojošās vārdnīcas). Dažām valodām ir valodas resursu pārpilnība, citām, īpaši jauno Eiropas Savienības dalībvalstu valodām (t. sk. latviešu), ir izteikts pamatresursu trūkums. Turklāt, tā kā resursi un rīki tiek izstrādāti decentralizēti, tie ir izkliedēti, apgrūtinot vienotas izmantošanas un integrēšanas iespējas.
CLARIN piedāvā izveidot salīdzināmu galveno valodas resursu un rīku komplektu visām valodām, kas iekļautas infrastruktūrā. CLARIN ietvaros par valodas resursiem tiek domāts ne tikai sinhronajā, bet arī diahronajā aspektā, kas sniegtu ieguldījumu Eiropas multikulturālā un multilingvālā mantojuma saglabāšanā un atbalstīšanā.
Rakstītu un pēdējā laikā arī runātu tekstu ierakstu apjoms tīmeklī ir milzīgs, tas pieaug eksponenciāli. Materiāla daudzuma dēļ humanitāro un citu zinātņu pētniekiem, kas izmanto valodas materiālu, automatizētas metodes ir ārkārtīgi nepieciešamas. Vēl jo vairāk attīstītas meklēšanas iespējas, kas balstītas uz dabīgo valodu analīzes tehnoloģijām, ir būtiskas ikvienam, kas tīmeklī meklē jebkāda veida informāciju. Lielu valodas korpusu uzkrāšanai, elektronizēšanai un anotēšanai, vārdnīcu un valodas aprakstu (metadatu) izveidošanai nepieciešami lieli laika un finansiālie resursi. Valodas materiāla apstrādei vajadzīgo rīku izveidei ir nepieciešamas dziļas zināšanas un iemaņas, īpaši, lai tie būtu piemēroti arī tiem lietotājiem, kas nav valodniecības vai valodas tehnoloģiju speciālisti.
CLARIN pētniecības infrastruktūra ir paredzēta, lai palīdzētu tiem, kas darbojas humanitāro un sociālo zinātņu jomā, ir saistīti ar valodu un kam ir nepieciešamas automatizētas tehnoloģijas.
CLARIN pārvaldes struktūra
CLARIN ir Eiropas mēroga bezpeļņas iniciatīva ar daudzslāņainu pārvaldes struktūru. Tā balstās uz dalībvalstu ieguldījumu un apvieno arī citas pārvaldes struktūrā ieinteresētās personas valdības un nacionālās finansēšanas aģentūras. CLARIN izveidotas šādas galvenās padomes:
- Izpildkomiteju pārstāv pazīstami nozares eksperti, tā vada CLARIN darbu un ir atbildīga par visu operatīvo darbību;
- Uzraudzības padomē darbojas pārstāvji no nacionālajām CLARIN grupām, un tā pieņem lēmumus stratēģiskā līmenī;
- Valsts pārstāvju padomē darbojas valsts pārvaldes un finansēšanas aģentūru pārstāvji, kas rūpējas par finansiālajiem un organizatoriskajiem jautājumiem, kā arī pārstāv valsts intereses;
- Lietotāju konsultatīvajā padomē darbojas dažādu valstu attiecīgās nozares speciālisti, lai pārstāvētu savas vajadzības un intereses.
Clarin biedri
Pašlaik (10.06.2011.) CLARIN iniciatīvā piedalās 208 biedri no 33 valstīm: Austrijas, Beļģijas, Bulgārijas, Čehijas, Dānijas, Francijas, Grieķijas, Horvātijas, Igaunijas, Islandes, Itālijas, Izraēlas, Īrijas, Kipras, Lietuvas, Luksemburgas, Maltas, Nīderlandes, Norvēģijas, Polijas, Portugāles, Rumānijas, Serbijas, Slovēnijas, Somijas, Spānijas, Turcijas, Ungārijas, Vācijas, Zviedrijas. CLARIN biedri Latvijā ir LU Matemātikas un informātikas institūts un Tilde.