Ohjelmistokäännösten kivikot

Artikkeli on alun perin julkaistu Skrollin numerossa 2013.4.

Tietotekniikan käyttäjä huomaa yhäkin kielikukkasia suomenkielisissä ohjelmissa. Selvitimme, mistä käännösongelmat saavat alkunsa ja miten ohjelmistoja ylipäänsä käännetään.

Teksti: Mikko Heinonen
Kuvat: Manu Pärssinen

”Valitse Asetukset, napsauta sitten painiketta Tiedot ja valitse Ota käyttöön”, toteaa ohjelmauutuuden käyttöohjetiedosto. Käyttäjä sen sijaan näkee edessään ihan erilaisen ikkunan, jossa näkyy ”Valinnat”, ”Lisätiedot” ja ”Käytä”. Käyttöohjeesta apua etsivä käyttäjä kiroaa mielessään, eikö se kääntäjä ole edes nähnyt tätä ohjelmaa?

Lyhyt vastaus on, että ei useinkaan ole. Ja vaikka olisikin, hänellä ei ehkä ole ollut lupaa muuttaa virheellistä käännöstä. Jotta voisimme ymmärtää, miksi tällaista tapahtuu, pitää aloittaa varsin kaukaa.

Kielenkääntäjästä tulee useille yhä mieleen kammiossaan istuva ammattilainen, joka ansaitsee elantonsa kääntämällä kaunokirjallisia teoksia. Televisio-ohjelmia ja elokuvia taas suomentavat AV-kääntäjät, jotka nousivat julkisuuteen suurten mediatalojen ulkoistettua käännöstoimintansa. Kolmas ammattiryhmä käännösalalla ovat tekniset kääntäjät, joiden vastuualueita ovat käyttöohjeet, viralliset asiakirjat ja ohjelmistojen lokalisoinnit. Jotkut moniottelijat tekevät kaikentyyppistä käännöstyötä, mutta useimmat kääntäjät keskittyvät vain yhteen lajityyppiin.

Kone muistaa, ihmistä tarvitaan

Tekninen kääntäminen eroaa kirjallisuuden kääntämisestä ja AV-kääntämisestä siinä, että se on hyötynyt eniten tekniikan kehityksestä. Koska esimerkiksi käyttöohjeet ja ohjelmistot sisältävät runsaasti samoja ilmauksia ja käytäntöjä, on niin sanottujen käännösmuistien käyttö muodostunut keskeiseksi työkaluksi teknisessä kääntämisessä. Käännösmuisti tallentaa kaikki tiettyä projektia koskevat semanttiset yksiköt – esimerkiksi yksittäiset sanat, lauseet tai virkkeet – suureen tietokantaan, josta niitä voidaan myöhemmin hakea.

Ihannetilanteessa käännösmuisti on erinomainen työkalu. Sen avulla samaa projektia voi tehdä vaikka usea kääntäjä samanaikaisesti ja tyyli pysyy yhtenäisenä, kunhan kaikki noudattavat vanhojen käännösten sanastoa ja ilmaisutapaa. Myöhempien päivitysten teko helpottuu huomattavasti, kun kaikki aiemmat käännökset ovat käytettävissä.

Käännösmuistin käyttöä ei ole syytä sekoittaa konekääntämiseen, vaikka niillä samoja piirteitä onkin. Käännösmuisti ei osaa kääntää automaattisesti kuin täsmälleen samanlaisina toistuvat jaksot. Kaikkeen muuhun se osaa tehdä vain ehdotuksia, joita ihmisen pitää muokata. Englanninkielinen termi Computer Assisted Translation tarkoittaa juuri tätä. Suomen kaltaisen kielen tapauksessa erona on myös se, että tietokoneavusteinen käännös nopeuttaa kääntäjän työtä, siinä missä konekäännöksen sijamuotojen ja sanavalintojen korjailu lähinnä hidastaa sitä.

Rengistä isännäksi

Kääntäminen maksaa rahaa, joten yrityksen taskulaskinosasto haluaa säästöjen nimissä käyttää samoja käännöksiä aina kun mahdollista. Tämä on myös järkevää kielen yhtenäisyyden kannalta ja helpottaa uusien kääntäjien ottamista mukaan työhön.

Jossain vaiheessa käy kuitenkin niin, että käännösmuistista tulee lopputulosta rasittava riippakivi. Osa suurten ohjelmistojen käännöksistä saattaa olla yli 15 vuotta vanhoja. Tietotekniikan sanasto on tällä välillä voinut muuttua moneen otteeseen, ja toisaalta ei ole lainkaan varmaa, että kaikki alkuperäistä ohjelmaa kääntäneet ovat tienneet, mistä tarkalleen on kysymys.

Vaikka nykyinen kääntäjä olisi perustellusti eri mieltä käännösmuistin kanssa, vanhaa käännöstä on usein pakko käyttää yhteneväisyyden nimissä – tai ainakin siksi, ettei sen muuttamisesta makseta kenellekään. Monet yritykset vain ajavat vanhat käännökset sisään automaattisesti eivätkä tarkista, pitävätkö ne vielä paikkansa. Niinpä uusikin ohjelmisto voi ihan sujuvasti jutella käyttäjälle levykkeistä tallennusvälineinä.

Tarpeeksi paisuttuaan käännösmuisti alkaa sisältää samalle asialle erilaisia käännöksiä. On jopa voitu toteuttaa projekti, jossa ikivanhoja käännöksiä on korjailtu nykyaikaisemmiksi mutta vanhat on jätetty muistiin kummittelemaan. Aloitteleva kääntäjä, joka ei tunne käännettävää ohjelmistoa, ei luonnollisestikaan tiedä, mikä käännösmuistin tarjoamista vastineista pitäisi valita. Usein aloittelevan kääntäjän on myös palkannut yritys, joka on tarjonnut työstä halvimman hinnan.

Lue se manuaali, jos pystyt

Riippuvuussuhteet tulevat vieläkin monimutkaisemmiksi, kun samaan projektiin kuuluvat sekä ohjelmisto että käyttöohje. Ohjelmisto luonnollisesti käännetään ensin, minkä jälkeen käyttöohje usein kilpailutetaan erikseen ja annetaan jollekin toiselle ryhmälle tehtäväksi.

Käyttöohjeen kääntäjille annetaan tavallisesti vain lista, jossa on lueteltu ohjelman käyttöliittymän käännökset. Vain ani harvoin heille annetaan itse ohjelmaa. Tätä listaa on sitten noudatettava kuin pyhää kirjaa, ja myös sen virheet on jäljennettävä. Aina ei ole tietoa käyttöliittymästä, jolloin kääntäjä arvailee parhaansa mukaan ja syntyy tämän artikkelin aloituskappaleen mukaisia tilanteita.

Joskus kääntäjätkin ylisuorittavat ja huomauttavat ohjelmistossa olevista virheellisistä teksteistä. Yleensä se ei johda mihinkään, sillä käyttöohjetta käännettäessä ohjelmisto on jo ”kiinni”, eikä siihen enää tehdä muutoksia. Parhaassa tapauksessa muutos saattaa tulla seuraavaan versioon, mutta kieliasiat ovat harvoin niin keskeisiä, että asiaan jaksettaisiin panostaa.

Seuraava mahdollisuus virheellisen käännöksen korjaamisen tulee vastaan silloin, kun jokin tekninen seikka pakottaa kirjoittamaan kyseisen kohdan uusiksi. Tällöin virheellinen käännös onkin jo usein levinnyt niin moneen paikkaan, ettei sen täydellinen poistaminen ole enää mahdollista.

Kuva: Manu Pärssinen

Termistöjen sekamelskaa

Yrityksen viestintä on tärkeä osa sen julkisuuskuvaa, ja moni on ottanut kielen mukaan imagonsa luomiseen. Joskus tuntuu, että markkinointipuolella laaditaan kilpaa erilaisia tyylioppaita ja kehitetään omaa sanastoa. Sen seurauksena samoja asioita käännetään monella eri tavalla. Esimerkiksi icon voi olla suomeksi kuvake, ikoni tai symboli. File on tiedosto tai arkisto, riippuen siitä, missä käyttöjärjestelmässä ollaan. Sama koskee monia muitakin keskeisiä termejä.

Kääntäjän näkökulmasta tämä aiheuttaa runsaasti ongelmia, sillä usein esimerkiksi ohjelmiston Windows- ja Mac OS -versiot tulevat käännettäviksi samaan aikaan. Alkukielinen teksti ei erottele eri käyttöjärjestelmiä, vaikka käännöksissä niin tehtäisiin. Tällöin kääntäjän on ratkaistava, mitä varianttia käytetään, ja usein markkinaosuudet ratkaisevat.

Termistöjen suhteen parhaan arvosanan ansaitsee Microsoft. Ei siksi, että sen käännökset välttämättä olisivat mitenkään ylivertaisia. Syynä on se, että Microsoft on asettanut lähes kaikki tekemänsä käännökset vapaasti saataville. Microsoft Language Portal -sivustosta löytyvät kaikkien tärkeimpien ohjelmistojen käännökset kaikille kielille. Sivuston hakutoiminnon tuloksista on mahdollista tutkia, missä tuotteessa kutakin käännöstä on viimeksi käytetty. Näin on helppoa poimia omaan käyttöön ajantasainen viittaus esimerkiksi Windows 8:n käyttöliittymään.

Rakas, rikas äidinkielemme

Aivan oman mausteensa käännöskeitokseen antavat suomen kieli ja sen taivutusjärjestelmä. Jokainen suomenkielisiä ohjelmia käyttänyt on varmasti törmännyt sanoihin ”kohde” ja ”järjestelmä”, jotka eivät yleensä tarkoita yhtään mitään tilanteissa, joissa niitä käytetään. Kyse onkin tilkesanoista, joilla suomen taivutus saadaan sopimaan anglosaksiseen ympäristöön.

Tilkesanoihin päädytään useimmiten silloin, kun tekstissä on tavaramerkkejä tai muuttujia, jotka estävät normaalin taivuttamisen. Monet suuryritykset valvovat tarkasti tavaramerkkejään ja kieltävät ehdottomasti niiden taivuttamisen, koska joku ilmeisesti saattaisi tulkita, ettei taivutettu merkki enää olekaan rekisteröity.

Toisilla yrityksillä taas on tapana tehdä monia versioita ohjelmistostaan, jolloin vaikkapa ”SuperSystem 8000 Ultra-Professional” ja ”SuperSystem 7500 Piss-Poor” näkyvät kääntäjälle havainnollisena muuttujana ”%s” tai ”%ProdName”. Näin syntyy kukkasia kuten ”SuperSystem-järjestelmään” eli ’superjärjestelmäjärjestelmään’. Voin vakuuttaa, että tämä särähtää kääntäjänkin korvaan, mutta mitään muuta vain ei ole tehtävissä.

Sana ”kohde” taas pitää tulkita niin, että kääntäjä on saanut eteensä pelkän luettelon viittauksia, joiden tilalle ohjelmistossa voidaan vaihtaa yksi tai useampia sanoja. Tyyppiesimerkki tällaisesta on vaikkapa ”copy %1 from %2 to %3”. Tässä %1 on ilmeisesti tiedostonimi, joka ei kaipaa taivutusta, mutta ”%2 to %3” vaatisi jo suomessa sijamuotoja. On vain mahdotonta tietää, mihin kirjaimeen tai välimerkkiin ne loppuvat, joten tyyppi %2sta %3een ei onnistu. Puhumattakaan siitä, ettei muuttujan nimien perään useinkaan voi kirjoittaa suoraan ja että muuttujan kohdalle voi lauseessa tulla yksi tai useampia sanoja, mikä sotkee suomen yhdysmerkkisäännöt. Näin siis %1 kopioidaan kohteesta %2 kohteeseen %3 – taas kerran, varmuuden vuoksi.

Hyvin, huonosti ja hyvin huonosti

Ohjelmistokääntämisen ala on siis haasteita pullollaan. Toimittuani kokopäivätoimisena kääntäjänä toistakymmentä vuotta olen ehtinyt istua vähän joka puolella pöytää: aloittelijana ihmettelemässä uutta outoa tuotetta, idealistisena maailmanparantajana tekemässä kehitysehdotuksia ja kyynisenä palkkaorjana lätkimässä pieniä katkelmia jo menetettynä tapauksena pitämäni projektin sekaan. Välillä olen ihmetellyt, kuinka ylipäätään mitään saadaan käännettyä tolkullisesti. Onneksi olen myös saanut ilahtua siitä, miten toisissa yhtiöissä kieliasioihin suhtaudutaan riittävällä vakavuudella.

Kokemukseni pohjalta olen laatinut aloitteleville ohjelmistoyrityksille seuraavan taulukon, jota noudattamalla on helppoa munata ensimmäinen ohjelmistokäännösprojekti kokonaisvaltaisesti. Kaikki esimerkit ovat tosielämästä.

1. Tarjouskilpailu Hyväksy halvin käännöstarjous. Älä suotta tarkista, onko tarjoajan suomenkielisten projektien hallinta esimerkiksi Kiinassa tai puhuuko kukaan sen henkilöstöstä kohdekieltä. Näin varmistat niin pitkän alihankintaketjun, ettei sen lopussa nälkäpalkalla nyhertävää kääntäjää kiinnosta kurja softasi vähääkään.

Älä missään nimessä palkkaa alan koulutuksen saanutta ihmistä vastaamaan kieliasioista tai osta sellaisen palveluita. Ammattilainen saattaisi puuttua ohjelmistokehittäjien synnynnäisesti nerokkaisiin ratkaisuihin, jotka automaattisesti toimivat joka kielellä.

2. Käännettävä aineisto Lähetä käännettäväksi mahdollisimman varhainen versio ohjelmistosta ja muuta sitä useita kertoja matkan varrella. Toimita kaikki lisäykset eri tiedostomuodoissa ja vaihda esimerkiksi muuttujien merkintätapaa joka kerta.

Älä toimita mitään viiteaineistoa, josta kääntäjät voisivat tutustua aiempiin käännöksiin tai selvittää, mihin ohjelmistosi liittyy. Koska maksat heille, on heidän tehtävänsä selvittää tällaiset asiat parhaaksi katsomallaan tavalla eikä vain kopioida toisten jo tekemää työtä. Kieltähän kuitenkin käännetään kirjoittamalla samat sanat peräkkäin eri kielellä.

Muista, että kääntäjät toimivat sitä paremmin, mitä tiukempi aikataulu heille annetaan. Lähetä käännettävää myös jouluaatoksi, jolloin itse vietät aikaa perheen parissa. Tämä korostaa juuri sinun hankkeesi tärkeyttä.

Jos haluat todella varmistaa hyvän lopputuloksen, kehitä oma käännöstyökalu ja pyydä kääntäjiä syöttämään käännökset sinne. Tekniseen kääntämiseen tarkoitettuja ohjelmistoja on kehitetty vasta muutama kymmenen vuotta, joten yrityksesi kesäharjoittelija tekee varmasti paremman ensimmäisenä PHP-harjoitustyönään.

3. Kääntäjien kysymykset Ohjelmistokehitys on sen verran kiireistä puuhaa, että humanistit ovat siinä vain tiellä. Jos teknisillä kääntäjillä on jotain kysyttävää tuotteistasi, kannattaa laittaa taloon juuri tullut markkinointisihteeri vastaamaan kysymyksiin.

Missään nimessä ei kannata haaskata tuotteen tehneiden ohjelmoijien aikaa tällaiseen joutavuuteen, ja paras onkin jättää vastaamatta kääntäjien kysymyksiin.

4. Testaus Ohjelmiston testaus ja laadunvarmistus kannattaa myös antaa halvimman tarjouksen tehneelle, jos nyt laatua edes halutaan varmistaa. Esimerkiksi Kaukoidässä toimiva testauskeskus pystyy tarjoamaan aivan ainutlaatuista osaamista suomalais-ugrilaisissa kielissä.

Käännöksen laatu on helposti määritettävissä seuraavalla kaavalla: käännetyn tekstin pitää olla erilainen kuin alkuperäinen teksti mutta ei liian erilainen. Samoin kääntäjän työmotivaatiolle tekee hyvää, kun pääsee selittämään testaajalle neljännen kerran saman projektin aikana, mitä se sijamuoto taas tarkoittikaan.

On myös tärkeää, että kaikki ohjelmiston merkkijonojen pituudet pakotetaan englannin kielen mukaisiksi. Minkään kielen sanat eivät voi olla pidempiä. Merkkirajoista ei kannata kertoa kääntäjille etukäteen, sillä he ehtivät kyllä lyhennellä käännöksensä myöhemmin, samaan hintaan tietysti. Tämä työllistää myös mukavasti testaajia, kun he saavat ottaa sadoittain ruutukuvia näyttöteksteistä, jotka ovat keskeltä katkenneita.

Kirjoittaja on ollut mukana kymmenien eri ohjelmistojen lokalisoinnissa ja satojen käyttöohjeiden käännösprojekteissa. Tästä huolimatta hän on sitä mieltä, että tekninen kääntäminen on maailman paras työ.


Artikkeli on alun perin julkaistu Skrollin numerossa 2013.4.

Voit tilata lehden kätevästi täältä, niin voit lukea jutut kätevästi heti lehden saapuessa!

Captain Futile

25 vuotta alalla toimineena vielä yksi vinkki: Toimita käännösaineisto mielellään Wordiin kopioituna lähdekoodina tai osittain jo käännettynä Excel-tiedostona. JSON, XML ja muut lyhenteet ovat humanisteille liian vaikeita juttuja, mutta äkkiähän ne käännettävät kohdat sieltä C#-koodista huomaa.


PSu

Oma vinkki onnistuneelle käännökselle on selkeät lokalisaatiofileet joissa on selitetty konteksti, tarkoitus, missä kohtaa softaa teksti esiintyy, sekä ympätty mukaan käännettävä osio sekä englanniksi että suomeksi. Sitten jollekin softajuttuja osaavalle suomalaispuljulle käännettäväksi. Käyttöohjeiden käännöksiin ei onneksi ole tarvinnut sekaantua.


Uusi kommentti