Technologie voor vertalers
Bijna elk jaar wordt er door organisaties als Nimdzi en TAUS een inventarisatie gemaakt van de beschikbare taal- en vertaalsoftware. Anno 2022 zijn er een paar honderd applicaties op de markt die vertalers en tolken kunnen gebruiken. Wat moet je met al die software? Hoe kun je als vertaler bepalen welke tool nuttig is en welke niet?
Dit artikel vormt een beknopte inleiding tot technologie voor vertalers. Er wordt kort ingegaan op software die in de zogenaamde ‘technology landscape reports’ wordt opgenomen, maar er wordt vooral ruimte geboden aan technologie die niet noodzakelijk als ‘one-stop shop voor vertalers’ in de markt is gezet.
Voor vertalers lijkt een overzicht van beschikbare software handig, maar dat is het niet. Je raakt als vertaler verstrikt in een kluwen van merknamen en mogelijkheden. Wie een poging doet de kluwen te ontwarren, zal alleen maar meer bekneld raken. De laatste jaren zijn er niet alleen veel nieuwe tools op de markt gekomen; er zijn ook enorm veel termen en afkortingen gemunt om technologieën, functionaliteiten en processen van elkaar te onderscheiden.
Om een voorbeeld te geven: vroeger werd er simpelweg een onderscheid gemaakt tussen ‘CAT’ en ‘HA[M]T’ (respectievelijk: Computer-aided Translation en Human-aided [Machine] Translation)1; nu worden er allerlei termen en acroniemen bedacht om subtiele verschillen tussen vormen van mens-computerinteractie te duiden (bijvoorbeeld ‘Interactive Machine Translation’, ‘Adaptive Machine Translation’).
Het is geen wonder dat (met name) literair vertalers grif toegeven dat ze beperkt op de hoogte zijn van bestaande technologie en dat ze een lichte allergische reactie vertonen wanneer er weer voor nieuwe vertaalsoftware op de grote trom wordt geslagen.2 De verwarrende marktzetting van software werkt ontmoedigend. Hoe vinden we het bos weer te midden van al die bomen?
Vertaaltechnologie vs. machinevertaling
Een misverstand dat we in eerste instantie uit de weg moeten ruimen, is dat ‘vertaaltechnologie’ een synoniem van ‘vertaalmachine’ is. Hoewel machinevertaling historisch gezien aan de basis van vertaaltechnologie ligt, dienen de twee van elkaar te worden onderscheiden. Vertaalmachines produceren in een oogwenk een vertaling – of, voor de sceptici, iets wat voor een vertaling moet doorgaan. Vertaaltechnologie kan gericht zijn op een (super)snelle productie van vertalingen, maar dat hoeft niet het geval te zijn. Vertaaltechnologie is, zoals het acroniem ‘CAT’ al zegt, primair gericht op ‘ondersteuning’ van de vertaler. In de regel vormen vertaaltools een virtuele werkomgeving en bezitten ze de volgende gemeenschappelijke eigenschappen:
- Ze bieden een gealigneerde en gesegmenteerde weergave van bron- en doeltekst (in wording): bron- en doeltekst lopen gelijk, waardoor de vertaler makkelijk kan teruggrijpen naar de brontekst.
- Ze kunnen aan vertaalgeheugens worden gekoppeld: na gedetecteerde gelijkenis tussen een bronsegment en een vertaald segment uit het verleden, verschijnt de vertaaloplossing die in het verleden is gebruikt als suggestie.
- Ze kunnen aan een termbase worden gekoppeld: de tool herkent in de brontekst termen die in de termbase zijn opgeslagen en stelt voor de vertaaloplossing uit de termbase over te nemen.3
Computer-aided Translation-tools
De eerste vertaaltools werden in de jaren 1990 geïntroduceerd. De laatste jaren is de vertaaltechnologiemarkt uit haar voegen gebarsten. Een belangrijk wapen in de technologiewedloop is ‘integratie’. Traditionele CAT-tools, die enkel eigenschappen 1), 2) en 3) onderbrengen, zijn eindeloos uitgebreid: tegenwoordig heeft een CAT-tool zoveel functionaliteiten dat we spreken van ‘suites’ – vergelijkbaar met MS Office-pakketten. Enkele voorbeelden van functionaliteiten die de laatste jaren zijn toegevoegd:
- Projectmanagementinterfaces: vertaalprojecten kunnen worden beheerd in de tool zelf.
- Concordancers: woordgebruik kan in een bredere context worden opgezocht.
- QA-tools: onder andere taalkundige, terminologische en typografische problemen worden automatisch opgespoord.4
Het doel van vertaaltechnologie is vertaalprocessen vereenvoudigen. Het behoeft geen betoog dat de integratie van extra functionaliteiten dat doel dient. Toch is er een groot verschil tussen het doel dat softwareontwikkelaars voor ogen stond en het gesorteerde effect: uit onderzoek naar de ergonomie van vertalers is gebleken dat vertalers juist baat hebben bij een intuïtief systeem en een (optisch) ‘rustige’ werkomgeving. Met al die functionaliteiten wordt het scherm snel te druk, wat ten koste gaat van de productiviteit en zelfs het welbevinden van de vertaler.5
Een geïntegreerde functionaliteit die nog niet is vermeld, is – daar is ze weer: – machinevertaling. Met behulp van een Application Programming Interface-plug (of API-plug) is het tegenwoordig ook mogelijk vertaalmachines aan een CAT-tool te koppelen. Deze API’s vinden tegenwoordig gretig aftrek op de vertaalmarkt, aangezien er veel vraag is naar post-editingdiensten en veel vertaalbureaus en freelancers die diensten aanbieden.6 Toch is de houding ten aanzien van machinevertaling en post-editing lang niet altijd positief.7 Het is overigens niet zo dat je door een vertaalmachine aan je CAT-tool te koppelen onmiddellijk bent overgeleverd aan de automatische vertaling; doorgaans wordt er voorrang verleend aan oplossingen uit het vertaalgeheugen en de termbase (die idealiter betere oplossingen bevatten).
Computer-aided Literary Translation
Onderzoek heeft aan het licht gebracht dat vertalers technologie sneller omarmen als ze is afgestemd op de noden van de vertaler.8 De laatste jaren zien we dan ook dat softwareontwikkelaars niet louter zoeken naar manieren om nieuwe functionaliteiten te integreren, maar dat er steeds meer aandacht wordt besteed aan optimalisering van mens-computerinteractie, dat wil zeggen: een heuse samenwerking tussen mens en computer, waarbij de mens niet alleen op de computer reageert maar waarbij de computer zich ook afstemt op de mens.9 Ook sijpelt het besef langzaam binnen dat er binnen de vertaalwereld verschillende stielen zijn. De behoeften van een juridisch vertaler wijken af van die van een literair vertaler.
De laatste vijf jaar wordt er flink aan de weg getimmerd om de noden van literair vertalers in kaart te brengen en om na te gaan hoe bestaande maar ook te ontwikkelen technologie in die behoefte kan voorzien. Een term die recent ingang heeft gevonden, is ‘Computer-aided Literary Translation’ (CALT).10 Enkele bevindingen die in onderzoek naar CALT zijn gedeeld: literair vertalers hebben baat bij:
- Ruimere segmentering: de verdeling van de tekst in alinea’s is vaak wenselijk; in zakelijke vertaling geniet segmentering op zinsniveau de voorkeur.
- Engere ‘matching’: vertaalgeheugens hebben nut zolang ze niet alleen kijken naar overeenkomsten op zinsniveau, maar ook naar overeenkomsten op woord- en subwoordniveau.
- Meervoudige suggesties: door meerdere oplossingen aan te reiken, wordt de sturende of dwingende kracht van technologie afgezwakt.
- Stilistische brontekstanalyse: automatische detectie van stilistische patronen (woordgebruik, zinslengte, functionele herhalingen, klankpatronen) in de brontekst, kan leiden tot verbeterd inzicht in de brontekst en dus een accuratere weergave van de stijl van de brontekstauteur.
- Revisiegeheugens: geschrapte oplossingen dienen ook te worden opgeslagen, zodat ze de vertaler blijven aanzetten tot nadenken.
- Een interactief platform: zo’n platform kan collegialiteit en co-creatie bevorderen.11
Dit lijstje met bevindingen laat duidelijk zien dat het belangrijkste oogmerk van CALT de bevordering van tekstbegrip (inclusief stijlbegrip) en van creatieve processen is.
Technologie voor literair vertalers
Men is zich dus steeds meer bewust van de wensen van literair vertalers. De eerste ‘customized’ tools rollen voorzichtig van de band. Zo hebben Waltraud Kolb en Tristan Miller een eerste prototype van PunCAT ontwikkeld, een tool die gericht is op conceptuele processen in de vertaling van woordgrapjes.12 Van het programma wordt gezegd dat het het brainstormen vergemakkelijkt en leidt tot een toename van het aantal mogelijke oplossingen voor een creatief vertaalprobleem. De tool biedt namelijk de mogelijkheid om te switchen tussen de brontekstwoorden en hun betekenis en de lexicale netwerken waarin die woorden zijn ingebed (een soort mindmaps, dus) en de doeltekstwoorden, hun betekenis en lexicale inbedding.
Tim van de Cruys experimenteert dan weer met automatische weergave van literaire kenmerken zoals rijm en ritme.13 Zo analyseert de vertaalmachine twee verzen met eindrijm, en genereert zij op basis van de woorden uit die twee verzen de meest relevante rijmende oplossing. Het programma gooit de verzen dus een paar keer overhoop tot er een wenselijke uitkomst is. Het probleem is dat de woorden aan het eind van rijmende verzen niet zelden een semantisch verband vertonen. Daardoor ligt simpele rijmdwang (rijmen om het rijmen, los van literaire textuur) op de loer.
Hoewel er ontwikkelingen zijn ingezet, lijkt het er niet op dat CALT-tools in no-time de literaire markt gaan veroveren. Maar zelfs zonder échte CALT-tools kunnen vertalers hun vertaalproces met technologie verrijken.
Sterker nog: het staat buiten kijf dat zij dat al doen. Vertalers maken gebruik van digitale woordenboeken (verklarende en vertalende woordenboeken, rijmwoordenboeken, synoniemenwoordenboeken, collocatiewoordenboeken), thesauri en encyclopedieën. Ze raadplegen Het Groene Boekje voor spellingkwesties en steken, indien zij advies nodig hebben, hun licht op bij de Taalunie en Onze Taal. De e-ANS kan bij grammaticale kwesties met een paar muisklikken uitkomst bieden.
De ‘tools’ die hierboven staan vermeld, zijn vooral naslagwerken. Er zijn ook digitale werkomgevingen waarin literair vertalers hun werkzaamheden kunnen verrichten. Bekend zijn tekstverwerkers als MS Word en Pages. Ook deze programma’s zijn voorzien van functionaliteiten die de vertaler goed van pas komen (track changes, navigatiefuncties, spellingscheckers etc.). Toch zijn er ook ‘eenvoudige’ tools die vooral bij taalprofessionals in de smaak vallen. Een tool die al langere tijd door literair vertalers wordt gebruikt, is Scrivener. In deze tool is het mogelijk om brontekst en vertaling in een oogopslag te zien. Bovendien biedt de tool ruimte voor structureel redactiewerk, wat bijzonder handig is aangezien niet elke vertaler ‘lineair’ te werk gaat. Ook is er in het venster ruimte voor notities, zoekresultaten verwerken en ook mental notes voor jezelf aanmaken.
Ten slotte zijn ook (corpus)analysetools een vermelding waard. In tools als Voyant Tools, Sketch Engine en Lancsbox kun je stilistisch-narratologische aspecten van de brontekst in een paar muisklikken in beeld brengen.14 Zo kun je inzicht krijgen in frequent woordgebruik in de brontekst. Zeker bij langere teksten loont het de moeite om hiernaar te kijken. Die analyse kun je ook uitvoeren op collocaties, dat wil zeggen: woorden die vaak in elkaars directe omgeving worden aangetroffen. Dit kan taalkundig interessante informatie opleveren, maar kan ook conceptueel veel inzicht verschaffen. De meerwaarde van een analyse met corpusanalysetools is moeilijk te overschatten: de tools brengen informatie over de brontekst aan het licht die je zelfs in close reading soms over het hoofd ziet.15
Welke technologie je als literair vertaler ook gebruikt, de technologie heeft pas nut als zij voor jou werkt. Het is zinloos om ‘vertaaltechnologie’ te gebruiken, als de technologie voor jou niet werkt. Daarom is het ook vrij logisch dat literair vertalers zich aanvankelijk sterk hebben afgezet tegen of onverschilligheid hebben getoond tegenover traditionele CAT-tools, en dat zij vooral andere technologie hebben ingezet. De wind is echter aan het draaien: er verschijnen nieuwe hulpmiddelen op de markt die meer zijn afgestemd op de wensen van vertalers. Wellicht liggen er tools in het verschiet die literair vertalers een duwtje in de rug kunnen geven en zo de houding ten opzichte van vertaaltechnologie kunnen veranderen.
Voetnoten en leestips
1 De eerste classificatie werd opgesteld door Somers en Hutchins. Zie: Somers, J. & H. Hutchins (1992). An Introduction to Machine Translation. Londen: Academic Press.
2 Zie Daems, J. (2021). Wat denken literair vertalers echt over technologie. Webfilter. Geraadpleegd van Filter, tijdschrift over vertalen (19 september 2022). Zie ook: Ruffo, P. (2022) Collecting literary translators' narratives: towards a new paradigm for technological innovation in literary translation. In J. Hadley, K. Taivalkoski-Shilov, C. Teixeira and A. Toral (red.) Using Technologies for Creative-Text Translation (pp. 18-39). Londen: Routledge.
3 Zie Bowker, L. & D. Fischer (2010). Computer-aided Translation. In Y. Gambier & L. Van Doorslear (red.), Handbook of Translation Studies, Dl I (pp. 60-65). Amsterdam: John Benjamins.
4 Zie Bowker, L. & D. Fischer (2010). Computer-aided Translation. In Y. Gambier & L. Van Doorslear (red.), Handbook of Translation Studies, Dl I (pp. 60-65). Amsterdam: John Benjamins.
5 Zie O’Brien, S. & M. Ehrensberger-Dow (2017). Why Ergonomics Matters to Professional Translators. Geraadpleegd van Why Ergonomics Matters to Professional Translators – American Translators Association (ATA) (atanet.org) (19 september 2022). Zie ook: O’Brien, S., M. Ehrensberger-Dow, M. Hasler, & M. Connolly (2017). Irritating CAT Tool Features that Matter to Translators. Hermes Journal of Language and Communication in Business 56, pp. 145–162. Geraadpleegd van View of Irritating CAT Tool Features that Matter to Translators (tidsskrift.dk) (19 september 2022). Zie ook: Kappus, M. & M. Ehrensberger-Dow (2020) The ergonomics of translation tools: understanding when less is actually more. The Interpreter and Translator Trainer, 14:4, pp. 386-404. Geraadpleegd van Full article: The ergonomics of translation tools: understanding when less is actually more (tandfonline.com) (19 september 2022).
6 Post-editing is de vertaaldienst waarbij een vertaler de output van een vertaalmachine corrigeert. Post-editing heeft in het literaire veld tot op heden weinig voet aan de grond gekregen, maar wellicht verandert dat op termijn. Tijdens het panelgesprek ‘Translators: Robots in Disguise’ wijst Duncan Large op deze imminente verandering.
7 Zie Moorkens, J. & S. O’Brien (2017). Assessing user interface needs of post-editors of machine translation. In D. Kenny (red.) Human issues in translation technology (pp. 109-130). Londen: Routledge.
8 Voor een bespreking van ‘technology acceptance’, zie: Rossi, C. & J.P. Chevrot (2019) Uses and perceptions of machine translation at the European Commission. Journal of Specialised Translation 31, pp. 177–200.
9 Zie Englund-Dimitrova B. & M. Ehrensberger-Dow (2016). Cognitive Space: Exploring the situational interface of translation and cognition. Translation Spaces, 5,1, pp. 1-19. Zie ook: Läubli, S. & S. Green (2020). Translation technology research and Human-Computer Interaction (HCI). In M. O’Hagan (red.), The Routledge Handbook of Translation and Technology (pp. 370-383). Londen: Routledge.
10 De term is vooral in zwang gebracht door pioniers als Andrew Rothwell en Roy Youdale.
11 Zie Youdale, R. (2020). Using Computers in the Translation of Literary Style: Challenges and Opportunities. Londen: Routledge. Zie ook: Rothwell, A. (2020). Retranslating Zola in Stereo with CAT Tools. La traduction littéraire et SHS à la rencontre des technologies de la traduction : enjeux, pratiques et perspectives, Toulouse: Frankrijk. Zie ook: Ruffo, P. (2022) Collecting literary translators' narratives: towards a new paradigm for technological innovation in literary translation. In J. Hadley, K. Taivalkoski-Shilov, C. Teixeira and A. Toral (red.) Using Technologies for Creative-Text Translation (pp. 18-39). Londen: Routledge.
12 Zie Kolb, W. & T. Miller (2022). Human-computer Interaction in Pun Translation. Geraadpleegd van 9781003094159_10.4324_9781003094159-4.pdf (amazonaws.com) (19 september 2022).
13 Zie Van de Cruys, T. (2022). Constraint-based Neural Architectures for the Translation of Literary Texts. Paper gepresenteerd tijdens Network of Interdisciplinary Translation Studies in the Netherlands and Flanders (NITS) Conference. Groningen, Nederland.
14 In het Nederlandse taalgebied is Lisa Horenberg een van de trendzetters geweest die zich op dit soort tekstanalyse heeft gestort. Zie: Horenberg, L. (2021). Bloed, zweet, tranen en…. CAT? Webfilter. Geraadpleegd van Filter, tijdschrift over vertalen (19 september 2022).
15 Zie Youdale, R. (2020). Using Computers in the Translation of Literary Style: Challenges and Opportunities. Londen: Routledge. Zie ook: Rothwell, A. (2020). Retranslating Zola in Stereo with CAT Tools. Paper gepresenteerd tijdens La traduction littéraire et SHS à la rencontre des technologies de la traduction : enjeux, pratiques et perspectives. Toulouse: Frankrijk.