Ajal, mil tehisaru (AI) ja masintõlge on järjest tõhusamad, tekib paljudel õigustatud küsimus: milleks maksta tõlkijale, kui Google Translate sama teeb? Ning milleks palgata toimetaja, kui Chat GPT tekst ka okei välja paistab? Uurime, kui tasemel AI-tõlkimine täna siiski on.
Kuna eesti keele grammatika on võrreldes „suurte“ keeltega võrratult keerulisem – juba ainuüksi tänu käänetele ja astmevaheldusele – ning selle oskajaid-rääkijaid palju vähem (väiksema mahuga on ka eestikeelsed tekstikorpused), on väga täpset ja loomulikku masintõlget veel keeruline saavutada. AI:
- ei tunne paljudel juhtudel ära kõnekäände,
- ei oska valida kõige loomulikumat sõnastust,
- teeb otsetõlkeid ning vahel tõlgib suisa valesti.
Vaatame nüüd aga lähemalt, millega AI-tõlkimine hetkel (okt. 2024) kõige rohkem eksib.
Tõlgitud on sõnad, aga mitte mõtted
Põhiline AI-tõlkimise ja masintõlke probleem on see, et ükski popimatest tõlkelahendustest ei suuda veel tõlkida nii, et ta võtaks arvesse kogu konteksti: ta ei suuda arvestada, mis on teksti kui terviku mõte. AI jaoks on endiselt probleemne tabada varjatud mõtteid ja eristada olulist ebaolulisest.
Näiteks selline lause: This is considered the ultimate morphine drip.
- Google Translate’i tõlge: Seda peetakse ülimaks morfiini tilgutamiseks.
- Chat GPT 4o tõlge: Seda peetakse parimaks morfiini tilgutiks.
Sõna-sõnalt võttes tõlkisid masinad õigesti, aga tekst on ometi kuidagi kohmakas ja mõte hägune. Morfiin ja tilguti on meie keele- ja kultuurikontekstis esiteks väga reljeefsed sõnad, teiseks aga tekib küsimus, et milline see halb tilguti siis oleks?! Sarnaseid metafoorseid lauseid pole mõtet ega saagi alati otse tõlkida. Pigem on oluline sisu – morfiini tuimastav ja leevendav mõju. Inimtõlkija oskab sellega arvestada ja sõnastab näiteks nii: „Arvatakse, et see ongi kõige tõhusam tuimasti.“
Tühi rida
– Google Translate: Sõpruse säilitamiseks peatate uskmatuse.
– Chat GPT 4o: Sõpruse hoidmiseks peate peatama uskumise.
Jällegi, masinsõnad on justkui eestikeelsed, aga kus on mõte? Kui ingliskeelset originaali poleks, ei saaks arugi. Eestlane ütleks pigem: „Kui soovid sõprust hoida, ei tasu teise sõnu kahtluse alla seada“ või „Et sõprust säilitada, jätad kahtlused kõrvale.
Tühi rida
Veel toredaid kujutluspilte: The regiment was inspected by the general, all members in full dress.
- Google Translate: Rügemendi vaatas üle kindral, kõik liikmed täies riietuses.
- Chat GPT 4o: Kindral inspekteeris rügementi, kõik liikmed olid täisvarustuses.
Täies riietuses mehed, nagu Google Translate seda teeb, võib eesti keeles öelda küll. Aga kui mehed pole täies riietuses, kas nad siis on poolalasti? Neist kahest tõlkest valiks pigem Chat GPT „täisvarustuse“. Aga olenevalt kontekstist võib parem olla hoopis eestikeelne „paraadvorm“, mida kumbki tõlkeabi ei paku.
AI-tõlkimine: võõrapärased konstruktsioonid
Kui vaadata masina abil tõlgitud teksti keeletoimetaja pilguga, siis üldiselt kohtame sarnaseid vigu, mida teevad algajad tõlkijad. Nad kipuvad väga kinni olema ingliskeelse teksti lauseehituses, sest kardavad, et kui seda muuta, võib muutuda ka mõte.
Näiteks järgmised küsivad väited:
- It’s hot today, isn’t it? –> Täna on palav, kas pole?
- You like me, do you? –> Ma meeldin sulle, eks?
- I think he should try harder, shouldn’t he? –> Ma arvan, et ta peaks rohkem pingutama, kas pole?
Google Translate tõlgib ära ka tag-questions – inglise keeles väga levinud lauselõpu rõhuküsimused, mida eesti keeles ei esine. Kui taotleme teksti loomulikkust, peame arvestama, et eestlane üldjuhul ei lisa lause lõppu „kas pole“ või „on ju“ vms. Pigem kasutab ta mõnd lisasõna (näidetes sulgudes) või lisab hoopis eraldi lause. Toimetaja võiks need laused toimetada näiteks selliseks: „Täna on (päris) palav“, „Ma (vist) meeldin sulle“, „Mu meelest peaks ta rohkem pingutama. (Mis sina arvad?)“
Tühi rida
– Google Translate: Sarnaseid hoiatusi andsid ka Austraalia ja Suurbritannia valitsus.
– Chat GPT 4o: Sarnaseid hoiatusi anti Austraalia ja Suurbritannia valitsuste poolt.
Something was done by someone ehk poolt-konstruktsioon on klassikaline inglise keele mõju. Väga sageli kiputakse selliseid lauseid otse tõlkima. Siingi üks tõlkeabi kasutab poolt-konstruktsiooni, teine (Chat GPT ehk AI-tõlkimine) aga tõlgib kenasti. Sõna „poolt“ äravõtmine ja tegija aktiivseks muutmine ei muuda tavaliselt lause mõtet, pigem teeb ta lause meile omasemaks ja lihtsamaks.
Tühi rida
Jällegi üks ingliskeelne viis lauset pehmendada, mida kiputakse otse üle võtma:
- Why don’t you just wait, and I’ll get you some coffee?
- Chat GPT 4o: Miks sa ei oota lihtsalt, ma toon sulle kohvi?
- Google Translate: Miks sa ei oota ja ma viin sulle kohvi.
Tõlke tulemus on enam kui kohmakas. Eestlane ütleks selles kontekstis lihtsalt: „Palun oota (siin), ma kohe toon sulle kohvi.“
Tühi rida
Vahel muutub tekst tõlkes suisa kantseliitlikuks:
–
– Chat GPT 4o: Võiksite veeta rohkem aega õppides ja vähem aega videomänge mängides.
– Google Translate: Võib-olla soovite kulutada rohkem aega õppimisele ja vähem aega videomängudele.
Tühi rida
Ajavorme püüab masintõlge samuti hästi täpselt üle võtta:
- We were eating dinner at The Swan, remember?
- Chat GPT: Me olime õhtust söömas The Swanis, kas mäletad?
- Google Translate: Me olime The Swanis õhtust söömas, mäletad?
Present Continuous ja Past Continuous kiputakse väga sageli tõlkima mas-vormina, mis eesti keeles on pigem harvaesinev. Kui mõtleme, mismoodi me päriselt räägime, siis pigem ütleksime: „Kas mäletad, me sõime siis (parasjagu) The Swanis õhtust?“
AI-tõlkimine: stampväljendid ja tähenduskonksud
Mõnikord on võõrapärased väljendid muutunud meile nii omaseks, et me neid kohe ära ei tunnegi. Näeme neid sotsiaalmeedias, kuuleme raadios ja teleuudistes ning kohtame neid isegi oma laste kõnes. Pole siis ime, et leiame neid ka masintõlgetest.
Aga ainuüksi fakt, et väljend on levinud, ei tee seda õigeks või parimaks vasteks.
Näiteks järgmised laused:
- Massive winds continue to wreak havoc.
- Google Translate: Massiivsed tuuled jätkavad laastamistööd.
- Chat GPT: Massiivsed tuuled jätkavad hävingut.
Eesti keeles on „massiivne“ kogult suur või võimsana näiv (paks, raske vms), hävingut põhjustavad tugevad tuuled või hoopis tormituul.
Tühi rida
Või siis sõna, mis on väga levinud juba ka töökuulutustes, kus „otsitakse järgmisi ekspertiise“
– Thank you very much for offering your expertise
– Chat GPT: Suur tänu sinu ekspertiisi pakkumise eest.
– Google Translate: Tänan teid väga, et pakkusite oma teadmisi.
Siin tuleb tähele panna, et eesti keeles on ekspertiis asjaolude uurimine, mitte kellegi või millegi teadmised, kogemused või asjatundlikkus. Google Translate teab seda, Chat GPT (AI-tõlkimine) ei tea.
Tühi rida
Veel üks tähenduskonks, mille ka eestlased ise tihtipeale alla neelavad:
- The game was an epic battle between two great teams.
- Chat GPT: Mäng oli eepiline lahing kahe suure meeskonna vahel.
- Google Translate: Mäng oli eepiline võitlus kahe suurepärase meeskonna vahel.
Eepiline tähendab ÕSi järgi jutustav, üllas-rahulik, kiretu. Ühesõnaga, kõike muud kui üks võimas, võitluslik, enneolematu jalgpallilahing peaks olema. Keeletoimetaja kasutaks siin kindlasti mõnd teist, täpsemat sõna.
Tühi rida
–
– Chat GPT: Sa peaksid tõesti selle lisama oma ilurutiini!
– Google Translate: Sa peaksid selle tõesti oma ilurutiini lisama!
Eesti keeles tähendab rutiin juurdunud harjumust või üksluist korduvust. Rutiini sünonüümid on harjumus, komme, tava, kord, põhimõtted, meie aga räägime unerutiini(de)st, suuhooldusrutiinist, igapäevasest rutiinist, tantsurutiinist … Eesti keelele oleks omasem öelda iluharjumused, uneharjumused, suuhügieen, päevakava, tantsukava. Ja tasub ka märkida, et rutiin on eesti keeles sisult mitmuslik (selle all peetakse silmas järgnevaid tegevusi), aga vormilt ainsuslik, mistõttu „rutiinid“ mitmuses on praktiliselt alati vale ja liiane. Toimetaja versioon sellest lausest oleks: „Sul tõesti tasuks see kasutusele võtta!“ või „Sul tõesti tasuks see oma iluharjumuste osaks võtta“.
Tühi rida
Iseäranis moodne on tänapäeval sooritada mitmesuguseid „praktikaid“:
- Incorporating mental health practices into your daily routine can lead to significant positive changes in your life.
- Chat 4o: Mentaalsete tervise praktikate lisamine oma igapäevasesse rutiini võib kaasa tuua olulisi positiivseid muutusi teie elus.
- Google Translate: Vaimse tervise tavade kaasamine oma igapäevarutiini võib tuua kaasa olulisi positiivseid muutusi teie elus.
Eesti keeles tähendab „praktika“ tegelikku kasutust, rakendust, tegevust või siis ka teatud õppevormi või töökogemust. Taas on tegu ka ainsusliku sõnaga. Mitmus on inglise keele mõjuline, selle asemel on parem kasutada ainsust või siis leida teised, konteksti paremini sobivad sõnad. Keeletoimetaja võiks need tõlked toimetada näiteks selliseks: „Igapäevased vaimset tervist toetavad harjutused võivad muuta teie elu palju paremaks.“
Tühi rida
Ja lõpetuseks veel viimane moeväljend, mis on eesti keelde tulnud otse inglise keelest:
– „We are open for dialogue,” she said.
– Chat GPT 4o: „Me oleme dialoogiks avatud,“ ütles ta.
– Google Translate: „Oleme dialoogiks avatud,“ ütles ta.
Me oleme „suhteks avatud“ ja „koostööks avatud“, „pakkumistele avatud“ ja „avatud uuele“. Aga et vältida stampidesse langemist ja ilmset inglise keele mõju, võiks kõigi nende „avatud olemiste“ asemel öelda näiteks: „oleme valmis dialoogiks“, „olen valmis uueks suhteks või koostööks“, „ootan uusi pakkumisi“ ja „kohanen uuega kergesti“.
Tühi rida
AI-tõlkimine: vastutus lasub inimesel
Kokkuvõttes võib AI-tõlkimine sulle pakkuda nii vale ja/või kehvas keeles tõlke kui ka enam-vähem korraliku tõlke. Aga et aru saada, mis on mis, pead sa keelenüanssides olema üsna teadlik. Vastasel juhul palu hinnangu saamiseks abi pädevalt tõlkijalt või toimetajalt.
Mõnikord on tõesti nii, et inglise keelest laenatud sõnu on raske asendada või neile head vastet leida. Aga enamasti on küsimus pigem selles, et tõlkija sõnavara on ahtake – või siis on piiratud roboti kasutatav tekstimassiiv. Nii nagu inimese keeletaju areneb lugedes, sõltub masintõlke kvaliteet ju sellest, kui kvaliteetne on tekst, millel masinate tekstikorpused põhinevad.