Soome Turu ülikool on teedrajav algatus, mille eesmärk on arendada mitmekeelset tehiskeele korpust, mis valdab kõiki Euroopa keeli, sealhulgas eesti keelt. See ambitsioonikas projekt on vastuseks ChatGPT-taoliste mudelite levikule ja selle eesmärk on kaitsta vähemtähtsad keeled ChatGPT-järgsel ajastul. Kuigi Eesti Keele Instituut (EKI) toetab seda ettevõtmist, rõhutab see vajadust oluliselt suurendada digiteeritud eestikeelsete tekstide hulka, et tagada toimivate keelemudelite tõhusus.
Eleri Aedmaa, Eesti Keele Instituudi loomuliku keele töötlemise insener, rõhutas teksti koguse keskset rolli keelemudelite treenimisel. Ta rõhutas, et keele tuleviku kindlustamiseks on vaja digiteerida mitmekesiseid eestikeelseid tekste, sealhulgas ajaloolisi arhiive ja võrgukommunikatsiooni.
Turu ülikooli ja keeletehnoloogiaettevõtte SiloGeni juhitud algatuse eesmärk on luua maailma suurim avatud keelemudel, mis hõlmab kõiki Euroopa ametlikke keeli. Projekti eesmärk on kasutada Soomes Kajaanis asuva LUMI superarvuti arvutusvõimsust, et lahendada eesti keele mudelite tõhusaks treenimiseks vajalike digitaalsete eestikeelsete tekstide nappus.
Aedmaa tõi välja olemasolevate suurte keelemudelite olulise puuduse, märkides nende valdavalt ingliskeelset koolitust. Kuigi need mudelid saavad eesti keelest aru, toimivad nad peamiselt tõlkimise kaudu, mis kujutab endast pikaajalist ohtu eesti keele terviklikkusele ja kultuurilistele nüanssidele.
EKI keele- ja kõnetehnoloogia osakonna juhataja Kadri Vare rõhutas, et eesti keeleressursside täiendamiseks on vaja teha koostööd. Ta tõi esile käimasolevad algatused eesti keele andmete digiteerimiseks ja levitamiseks, rõhutades selle kriitilist rolli keele rikkuse ja identiteedi säilitamisel.
Kuna EKI jätkab tervikliku eesti keele korpuse koostamist, rõhutas Vare, kui oluline on avalikkuse osalemine keele säilitamise püüdluste toetamisel. Tema arvates on suuremahulistes keelemudeliprojektides osalemine oluline, et kaitsta eesti keelepärandit tulevaste põlvkondade jaoks.
More: https://news.err.ee/1609120697/finland-s-chatgpt-equivalent-begins-to-think-in-estonian-as-well
