Nieuwsbrief der Lage Landen 31: In gesprek met kunstmatige schranderheid

Kan ee-ai het Nederlands veredelen? ChatGPT, Grok en Gemini gaven het een poging.

Nieuwsbrief der Lage Landen 31: In gesprek met kunstmatige schranderheid
Die Kato dus beticht, is die wel buiten schuld?
Het geen hy voorneemt kan my niet verschrikk'lyk weezen.
Die op de deugd steunt heeft voor de ondeugd steets te vreezen;
Dies moet ik acht slaan op de list en schranderheid.
Een mond, die vruchtbaar is in streeken, snood beleid,
Zoekt my in stilligheid uit dit Paleis te trekken...
Hoe schrikt gy? kan myn zorg in u die vrees verwekken?
Een overtuigd gemoed ontdekt zyn eigen schuld.

—Pieter Langendijk (1683–1756) uit "Julius Cezar en Kato"

De Nieuwsbrief der Lage Landen is de terugkerende nieuwsuitgave van het Zaakwoordenboek der Lage Landen – waarin zowel bijzonder, zeldzaam en/of schoon Nederlands wordt uitgelicht als de laatste ontwikkelingen betreffende het zaakwoordenboek. Uitsluitend beschikbaar op Righartswoord. Tekene in om op de hoogte te blijven.

Geachte lezenaar(ster),

wijnmaandseinde nadert, tijd voor enen nieuw onderwerpe en tegelijkertijd het onderwerp onzes tijds: kunstmatige schranderheid, ofwel kunstmatige intelligentie ofwel artificiële intelligentie ofwel "ee-ai" (afkorting voor het Engelse artificial intelligence).

Voordat wij voortzetten wordt deze brief onderbroken voor een nieuwe uitgave van Taal Is In Beweging™! Dit keer, een onvergelijkelijke zwangse aankondiging die onlangs in mijn postvak verscheen.

Aanschouwe, het overhemd!

Neen...

Het overshirt!

Naam van de zaak eruit geknipt, want

Ontdek staat in de gebiedende wijs, dus ik hoop dat uwé begrijpt dat deze verkenning niet vrijwillig is. Het vest overshirt ziet er geriefelijk uit en ik ben van mening dat het een hedendaagse Engelse draai zal geven aan iedere kleerkast die deze behoeft.

Zover deze uitgave van Taal Is In Beweging; nu weer verder met het schrijfsel.

Kunstmatige Schranderheid

Kunstmatige schranderheid - Zaakwoordenboek der Lage Landen

Wat men ee-ai noemt is in veel gevallen een GPT-model, waarbij GPT een Engelse afkorting is van Generative Pre-trained Transformer, waar zover ik kon vinden nooit een Nederlandse tegenhanger is gemunt (op het vrij letterlijke 'Generatieve vooraf getrainde transformator' na, wat wel iets Nederlandser is). Om dit stuk niet nog langer te maken ga ik er nu niet verder op in, maar mogelijk kan hiervoor een leuke evenknie worden bedacht.

Zelf bezie ik kunstmatige schranderheid als een vernuft potlood—zolang het maar niet om wijsbegeerte, zedelijkheid of geschiedenis gaat, zeg ik daarbij—maar hoe scherp is dit potlood geslepen? Als wij deze onderredingstuigen zouden verzoeken om het Nederlands te veredelen, lukt dit hen? Wat als wij de schranderheden tegen elkander laten strijden, welke spreekt dan het beste Nederlands?

Ik heb een leenwoordenrijk stukje voorbereid. Deze bewoordingen zullen de schranderheden moeten veredelen zo goed als het lukt, waarna zij hun eigen leesting moeten beoordelen met een waarderingscijfer op het eind. Achteraf zal ik hun opdrachten nakijken, vergelijken en een winnaar kiezen. Dit zal ik op gevoel doen, want zo ernstig is deze oefening niet.

Dit kregen zij gevoerd:

Ik wil dat u een tekst leest (hieronder als "Te schouwen tekst" aangeduid) en vervolgens drie opdrachten uitvoert met dat stukje tekst. Ik deel eerst de tekst zelf en daarna de drie opdrachten. Voer eerst "Opdracht 1" uit, daarna "Opdracht 2", daarna "Opdracht 3".

Te schouwen tekst: "Volgens Ferdinand de Saussure bestudeert de linguïstiek
 (de participerende sociale code waarmee mensen communiceren, dus een abstract systeem dat hij "langue" (taal) noemt en dat strikt gediscrimineerd wordt van de individuele taaluitingen, die hij betitelt met de term "parole" (woord). "Langue" is dan de collectieve cognitie van een congregatie van gebruikers, en dus precies het segment van taalgebruik dat zich leent tot wetenschappelijke observatie en exposé. Bovendien is deze abstracte taal de essentie van het taalgebruik, los van de cosmetische en casuele differenties tussen gedragsreflexen."

Opdracht 1: herschrijf de "Te schouwen tekst" waarbij—in de nieuwe herschreven tekst—alle mogelijke leenwoorden (dit houdt in: Nederlandse woorden met een uitheemse oorsprong/etymologie) worden vermeden en vervangen door inheemsere evenwoorden/synoniemen. De tekst mag meer of minder woorden bevatten zolang de oorspronkelijke betekenis niet verloren gaat.

Opdracht 2: zie uw herschreven tekst zelf na. Leg uw gemaakte keuzen uit. Wees grondig en uitgebreid.


Opdracht 3: op een schaal van 1 tot 10, geef uw herschreven tekst een waarderingscijfer over de hoedanigheid van het Nederlands.

Zij, de deelnemers, zijn als volgt (tot drie beperkt omwille des schrijfsels lengte):

  • ChatGPT, van OpenAI.
  • Grok, van xAI.
  • Gemini, van Google.

Deelnemer #1: ChatGPT

Uitvoering: GPT-4o mini.

Opdracht 1: Herschreven tekst zonder leenwoorden
Volgens Ferdinand de Saussure onderzoekt de taalwetenschap de gemeenschappelijke afspraken waarmee mensen met elkaar spreken. Dit noemt hij een stelsel dat hij "taal" noemt, en hij maakt een scherp onderscheid met de persoonlijke taaluitingen, die hij "spraak" noemt. "Taal" is het gezamenlijke begrip van een groep sprekers, en juist dat deel van het taalgebruik leent zich voor wetenschappelijk onderzoek en beschrijving. Bovendien is deze gemeenschappelijke taal de kern van het spreken, los van de oppervlakkige en toevallige verschillen in gedragspatronen.

Opdracht 2: Toelichting op de gemaakte keuzes
- Linguïstiek → Taalwetenschap
: Het woord "linguïstiek" komt uit het Frans en stamt af van het Latijn. In het Nederlands is "taalwetenschap" een zuiver inheems alternatief.
- Participerende sociale code → Gemeenschappelijke afspraken: "Participerende" is een Latijns leenwoord via het Frans, en "code" heeft eveneens een uitheemse oorsprong. Ik heb gekozen voor "gemeenschappelijke afspraken" om hetzelfde idee uit te drukken zonder leenwoorden.
- Communiceren → Spreken: "Communiceren" is ontleend aan het Latijn. Het werkwoord "spreken" is een oorspronkelijk Nederlands woord dat dezelfde betekenis dekt in deze context.
- Abstract systeem → Stelsel: Het woord "abstract" komt uit het Latijn en kan vervangen worden door het Nederlandse woord "stelsel," wat verwijst naar een georganiseerde manier van werken of denken.
- Langue → Taal: Hoewel "langue" een technische term van Saussure is, heb ik deze in mijn vertaling aangepast naar "taal," omdat dit het meest in de buurt komt van het oorspronkelijke concept.
- Parole → Spraak: "Parole" is Frans en verwijst naar het gesproken woord. "Spraak" is een goed inheems equivalent dat deze betekenis nauwkeurig weergeeft.
- Congregatie → Groep: Het woord "congregatie" komt uit het Latijn via het Frans. "Groep" is een eenvoudig en veelgebruikt Nederlands woord dat de lading van "congregatie" prima dekt.
- Wetenschappelijke observatie → Wetenschappelijk onderzoek: Het woord "observatie" is ontleend aan het Latijn. Ik heb gekozen voor "wetenschappelijk onderzoek" omdat het net zo goed de betekenis van het onderzoeken en bekijken van taal omvat.
- Exposé → Beschrijving: "Exposé" komt uit het Frans, en "beschrijving" is een volledig Nederlands woord dat eenzelfde idee van uitleg of uiteenzetting overbrengt.
- Essentie → Kern: "Essentie" is afkomstig uit het Latijn. "Kern" is een inheems alternatief dat het idee van het diepste of belangrijkste deel goed weergeeft.
- Cosmetische → Oppervlakkige: "Cosmetisch" is Grieks-Latijns van oorsprong. "Oppervlakkig" geeft hetzelfde idee van iets aan de buitenkant zonder diepgang.
- Casuele → Toevallige: "Casueel" is afgeleid van het Latijnse "casualis." "Toevallig" is een Nederlands woord dat eenzelfde onvoorziene aard aanduidt.
- Differenties → Verschillen: "Differenties" komt van het Latijnse "differentia." "Verschillen" is een helder en inheems Nederlands equivalent.
- Gedragsreflexen → Gedragspatronen: Hoewel "reflexen" enigszins inheems is, komt het oorspronkelijk uit het Latijn. "Gedragspatronen" is een goed alternatief dat beter aansluit bij het Nederlandse taalgevoel, hoewel het woord "patronen" ook deels ontleend is, maar ingeburgerd.

Opdracht 3: Waardering van de herschreven tekst
Op een schaal van 1 tot 10 zou ik mijn herschreven tekst een 8 geven. De tekst is grotendeels in het Nederlands vertaald zonder leenwoorden, maar sommige nuances zijn moeilijk geheel inheems over te brengen zonder de oorspronkelijke betekenis van Saussure's theorie te verliezen. Begrippen zoals "langue" en "parole" zijn sterk verbonden met hun wetenschappelijke context en verliezen in een volstrekt inheemse vertaling een deel van hun technische precisie.

Deelnemer #2: Grok

Uitvoering: Grok 2 (beta).

Opdracht 1:
Volgens Ferdinand de Saussure onderzoekt de taalwetenschap (het deelnemende maatschappelijke stelsel waarmee mensen spreken, dus een denkbeeldig geheel dat hij "taal" noemt en dat streng gescheiden wordt van de persoonlijke spraakuitingen, die hij aanduidt met het woord "woord"). "Taal" is dan het gezamenlijke weten van een groep sprekers, en dus precies het deel van het spreken dat zich leent tot wetenschappelijk onderzoek en uitleg. Bovendien is deze denkbeeldige taal de kern van het spreken, los van de uiterlijke en toevallige verschillen tussen gedragsuitingen.

Opdracht 2:

  • taalwetenschap voor linguïstiek: 'Taalwetenschap' is een directe vertaling die in het Nederlands even gangbaar is als 'linguïstiek' en vermijdt het Griekse leenwoord.
  • onderzoekt voor bestudeert: Dit is een synoniem in het Nederlands dat geen leenwoord is.
  • stelsel voor code: 'Stelsel' is een Nederlands woord voor systeem of structuur, waar 'code' een leenwoord uit het Latijn via het Frans is.
  • denkbeeldig geheel voor abstract systeem: 'Denkbeeldig geheel' geeft het abstracte karakter weer zonder gebruik van leenwoorden.
  • gescheiden voor gediscrimineerd: 'Gescheiden' is een Nederlands woord dat het onderscheid aanduidt zonder het negatieve connotation van 'discrimineren'.
  • aanduidt voor betitelt: 'Aanduiden' is een inheems werkwoord dat hetzelfde betekent als 'betitelen'.
  • gezamenlijke weten voor collectieve cognitie: Hier vermijd ik 'cognitie' (Latijn) door 'weten', wat echt Nederlands is.
  • groep sprekers voor congregatie van gebruikers: 'Groep sprekers' is directer en vermijdt het kerkelijke 'congregatie'.
  • spreken en spraakuitingen voor taalgebruik en taaluitingen: Deze keuze behoudt de betekenis maar blijft bij de kern van de taal, namelijk spreken.
  • kern voor essentie: 'Kern' is een Nederlands woord dat goed de betekenis van 'essentie' overbrengt.
  • uiterlijke en toevallige verschillen voor cosmetische en casuele differenties: Dit zijn meer Nederlandse beschrijvingen voor de begrippen.

Opdracht 3:
Ik zou mijn herschreven tekst een 8 geven. De tekst blijft begrijpelijk en behoudt de oorspronkelijke betekenis goed, terwijl de meeste leenwoorden zijn vermeden of vervangen door inheemse woorden. Echter, het woordgebruik kan soms iets minder nauwkeurig of natuurlijk aanvoelen in vergelijking met de oorspronkelijke tekst vanwege de beperkingen die het vermijden van leenwoorden met zich meebrengt.

Deelnemer #3: Gemini

Uitvoering: 1.5 Flash.

Opdracht 1: Herschrijven zonder leenwoorden
Naar het inzicht van Ferdinand de Saussure bekijkt de taalwetenschap de taal als een stelsel van tekens dat mensen gebruiken om met elkaar te spreken. Dit stelsel, dat hij de 'taal' noemt, is volgens hem iets anders dan de individuele uitingen van die taal, die hij 'woord' noemt. De 'taal' is het gedeelde kennisbestand van een groep taalgebruikers en dus het deel van de taal dat wetenschappelijk bestudeerd kan worden. Deze abstracte taal is de kern van het taalgebruik, los van de toevallige verschillen tussen de manier waarop mensen spreken.

Opdracht 2: Toelichting op de keuzes
- Linguïstiek → taalwetenschap:
Dit is een vrij directe vervanging, waarbij het geleerde woord 'linguïstiek' wordt vervangen door de meer Nederlandse term 'taalwetenschap'.
- Participerende → deelnemende: 'Participerende' is een deelwoord van het werkwoord 'participeren', dat zelf weer een leenwoord is. 'Deelnemende' is een meer inheemse variant.
- Sociale code → stelsel van tekens: 'Sociale code' is een relatief moderne term, terwijl 'stelsel van tekens' een meer klassieke manier is om naar taal te verwijzen.
- Abstracte → onzichtbaar: 'Abstracte' is lastig te vervangen zonder de betekenis te veranderen. 'Onzichtbaar' benadrukt het idee dat de taalstructuur niet direct waarneembaar is, maar wel aanwezig.
- Congregatie → groep: 'Congregatie' is een formeel woord voor een verzameling mensen. 'Groep' is een algemener en meer toegankelijk woord.
- Exposé → uiteenzetting: 'Exposé' is een Frans leenwoord dat vaak in academische contexten wordt gebruikt. 'Uiteenzetting' is een meer Nederlandse manier om te zeggen dat iets wordt uitgelegd.
- Cosmetische → uiterlijke: 'Cosmetische' verwijst naar het uiterlijk. 'Uiterlijke' is een synoniem.
- Casuele → toevallige: 'Casuele' betekent 'toevallig'.

Opdracht 3: Waardering
Ik zou mijn herschreven tekst een 8 geven op een schaal van 1 tot 10. Hoewel de betekenis behouden is, is het vervangen van alle leenwoorden een uitdaging. Sommige vervangen woorden voelen misschien wat houterig aan, zoals 'onzichtbaar' in plaats van 'abstract'. Daarnaast is het mogelijk dat er nog andere, meer elegante manieren zijn om bepaalde concepten uit te drukken. Desondanks vind ik dat de tekst goed leesbaar is geworden en dat de essentie van de oorspronkelijke tekst is overgebracht.

Opmerkingen:
- Het vervangen van leenwoorden kan soms ten koste gaan van de precisie of nuance van de oorspronkelijke tekst.
- Sommige leenwoorden zijn zo ingeburgerd dat het zoeken naar een synoniem onnatuurlijk kan aanvoelen.
- Het is belangrijk om rekening te houden met de context waarin de tekst wordt gebruikt. In sommige situaties zijn leenwoorden juist gewenst.

De Schouwing

Opdracht voor opdracht gaan wij de ee-ai's even langs, om te zien wie de beste was in ieder der onderscheidenlijke opdrachten. Mijn oordeel zal niet te flauw zijn, waar ik woorden zonder duidelijke tegenhanger minder hard zal afstraffen dan woorden waar duidelijke tegenhangers bekend zijn. Waar mensen hun geheugen de schuld kunnen geven ("oh ja"), verleen ik deze nullen en enen niet die weelde.

Opdracht 1

  • ChatGPT: Vrij letterlijk, maar alsnog duidelijk. Het leuke van deze oefening is dat het heel mooi laat zien dat als uitheemse woorden worden gebruikt om een begrip te duiden deze door de mand valt wanneer de betekenis in acht wordt genomen (langue > taal). Zo zal ik nooit vergeten dat ik ooit een cv van iemand zag die was geleerd in maatschappijleer en sociologie.
  • Grok: De tekst loopt niet helemaal soepel en Grok behoudt "precies", wat een hele makkelijke is om te vermijden. Wel krijgt Grok lof voor het gebruik van "gedragsuitingen", wat ik een leuke tegenhanger vond.
  • Gemini: Gemini behoudt meer woorden dan Grok ("individuele", "abstracte" en "manier")...dus niet al te best. Doch, Gemini koos ervoor om de tekst anders te schrijven om het vloeiend te maken – dit is ook iets wat ik soms doe als ik klem raak met woordvermijding. Sommige leenwoorden zijn immers niet altijd even makkelijk een-op-een te vervangen (zoals het Engels toast (één woord) > Nederlands geroosterd brood (twee woorden)), om het te kunnen veredelen moet de zin soms in zijn geheel worden herschreven.

Winnaar: ChatGPT.

Opdracht 2

  • ChatGPT: "abstract systeem" inkorten tot enkel "stelsel" is opmerkelijk, maar verder veel veilige zetten. Inzonderheid vond ik "oppervlakkig" voor "cosmetisch" een fraaie vervanging, waarbij de andere twee voor "uiterlijk" kozen wat alhoewel een evenwoord is, niet dezelfde lading dekt. Dit is maar een voorbeeld dat bij mij de indruk wekt dat ChatGPT dus "dieper" lijkt te kijken dan de andere twee.
  • Grok: Grok komt meteen binnen met geheel uitgevonden woordafleiding door linguïstiek Grieks te noemen terwijl het een hele duidelijke Franse ontlening is. "Gezamelijke weten" voor "collectieve cognitie" vond ik echter weer een schone. Verrassend, zowel in de vergissingen als de voorstellen.
  • Gemini: onzichtbaar voor abstract... Stelsel van tekens voor sociale code... Toch meer missers dan de eerdere twee. Gezien het vermogen van Google had ik hoog ingezet op Gemini, maar omvang is geen wisheid voor hoedanigheid.

Winnaar: ChatGPT.

Opdracht 3

  • ChatGPT: Een 8 in dezen vond ik wel eerlijk. Het kan fraaier, maar het gaat vooral om luisteren naar de opdracht en niet zozeer de mooiste Nederlandse tekst dichten.
  • Grok: Als wat ChatGPT een 8 is hebben wij nu een maatstaf, en gezien de toch meer rommelige bewerking kan hij geen 8 krijgen. Dat gezegd hebbende, Grok had verder wel een hoop der woorden vermeden, waar het eigenlijk om ging. Grok krijgt van mij om die reden een 6.
  • Gemini: Gemini valt meteen op, want die had—zonder mijn rechtstreeks onderricht—zelf aanmerkingen toegevoegd bovenop de opdracht. Enerzijds is hier dus voor te zeggen dat Gemini buiten zijn (haar?) kaders treedt als een teken van aantoonbaar denkvermogen, anderzijds is ook te stellen dat er niet goed naar de opdracht werd geluisterd, want ik had niet gevraagd om aanmerkingen.
    Daarnaast waren er ook te veel leenwoorden behouden in de herschreven tekst, dus een 8 is zachtjes gezegd stuitend. Ik geef Gemini, helaas, een 4.

Winnaar: ChatGPT.

De Schranderste der Schranderheden

Een oneerlijke hoofding weliswaar, gezien de weinige deelnemers, maar er is enkel één te kronen en dat is zonder twijfel ChatGPT .

Voordat uwé denkt dat ik ChatGPT een oneerlijk voordeel heb gegeven in mijn schouwing, ik gebruik zelf Grok het meest gezien deze iets meer is ontgrendeld dan de andere twee, maar de mate van taalbeheersing van ChatGPT spreekt voor zichzelf.

Tot de volgende brief.

Hoogachtend,
C. J. Righart
ᛋᛇ᛬ᛃᛇ᛬ᚱᛁᚷᚺᚨᚱᛏ