Piedalies "Balsu talkā" jeb palīdzi mākslīgajam intelektam apgūt latviešu valodu!

Published: July 11, 2023, 7:07 a.m.

Vai pagājušajā nedēļā ziedojāt savu balsi "Balsu talkā"? Nē? Un nav skaidrs, par ko vispār ir runa? Dziesmu un deju svētku nedēļā sociālās iniciatīvas "Balsu talka" organizatori aicināja Latvijas iedzīvotājus un jo īpaši svētku dalībniekus ziedot savu balsi jeb ierunāt piecus teikumus vietnē balsutalka.lv, un tā sniegt savu ieguldījumu, lai mākslīgais intelekts ātrāk iemācītos "saprast" un komunicēt latviešu valodā. Šī gada laikā mērķis ir savākt 1000 stundas. Kā veicies svētku laikā un kāda ir iespēja iesaistīties turpmāk, raidījumā Kā labāk dzīvot skaidro Latvijas Atvērto tehnoloģiju asociācijas vadītājs, digitālās vides piekļūstamības eksperts Pēteris Jurčenko, IT speciālists, programmatūras tulkošanas entuziasts Raivis Dejus, LU Matemātikas un informācijas institūta Mākslīgā intelekta laboratorijas vadošā pētniece Ilze Auziņa un UNESCO Latvijas Nacionālās komisijas Komunikācijas un informācijas sektora vadītāja Beāte Lielmane. "Lielākā daļa latviešu valodas runas datu, kas šobrīd pieejami, ko izmanto zinātniskās institūcijas un valodu tehnoloģiju uzņēmumi, nav brīvi pieejami, tas kavē plašākus pētījumus un inovācijas. Lai iegūtu pēc iespējas vairāk un daudzveidīgākus runas datus, nolēmām organizēt "Balsu talku"," skaidro Ilze Auziņa. Mājas lapā var redzēt, ka ir ierunātas 127 stundas no 200 nepieciešamajām, pārbaudītas ir 62 no tām. "Šobrīd norādītās nepieciešamās 200 stundas ir nākamais mērķis, bet jo vairāk, jo labāk. Vēlamies savākt 1000 stundas, ja tas būs izdarīts, situācija būs tāda, kā lielajām valodām – angļu vai vācu valoda," atzīst Raivis Dejus. Teksts, ko ierunāt, pašam nav jāmeklē un jādomā, mājaslapā iedos teikumu, kas jāielasa normālā balsī, kā runā. Vēlams pārbaudīt to pēc ieraksta pārbaudīt, vai nav kļūdas vai neskan kaut kas fonā, vai nav bijusi pārteikšanās. Šādā gadījumā vajadzētu ierakstīt vēlreiz.  Visi ierakstītie teksti krājās datu bāzē un to publicē visiem publiski pieejamu, lai varētu izmantot pētnieki, gan tehnoloģiju uzņēmumi, kas grib attīstīt ar balsi darbināmus rīkus. Arī lielie pasaules uzņēmumi izmanto saviem rīkiem šos datus, lai dažādi rīki saprastu latviešu valodu un varētu tajā sazināties. "Lai savāktu 1000 stundas, vajadzētu 10000 cilvēku, kas katrs ierunā 100 tekstiņus," norāda Raivis Dejus. "Šobrīd ir ap 2500 cilvēku, kas ir ierunājuši. Tas jau ir daudz, vairāk nekā igauņiem un lietuviešiem." "Ja piecus teikumus ierunā, iekrīti azartā. Gribas vēl, paskatīšos, kas ir nākamajā teikumā, nākamajā lapā, kā spēle var būt. Ja atjaunos iespēju pārbaudīt, var klausīties un un mēģināt saklausīt kādu pazīstamu cilvēku. Arī teikumi dažādi un interesanti," uzskata Ilze Auziņa. Runājot par drošības aspektiem, Pēteris Jurčenko norāda, ka vajadzētu satraukties nevis par to, ka es savu balsi nevienam nedodu, bet ka es neuzticos tikai balsij. "Ja tev zvana un drauga balsi saka - ziedo, dod man naudu, vajag mēģināt autentificēt un pārliecināties, ka viņš tiešām ir viņš," norāda Pēteris Jurčenko. "Otrs - par baidīšanos. Tas balss daudzums, kas nepieciešams, lai uzģenerētu cita cilvēka balsi, nav vajadzīgs liels. To var iegūt dažādos veidos, pat ja viņš nav ierunājis balsu talkā. Sociālie tīkli, piezvanīt, parunāties pa telefonu. Ir pilns ar dažādiem veidiem, kur daudz vienkāršāk var tikt pie balss materiāla konkrētam cilvēkam, nekā mēģināt izvilināt un atrast starp "Balsu talkas" dalībniekiem. Par drošību ir jāuztraucas, bet to var apiet citā veidā, daudz efektīvāk, nekā ja baidāties nodot savu balsi."