Hoe schrijft een computer zelf een tekst?

robothanden die typen.
© NRC

Taal en AI kent twee richtingen. Ofwel analyseert de robot bestaande teksten, ofwel schrijft hijzelf ‘nieuwe’ content. Het spreekt voor zich dat het generatieve model (= zelf nieuwe content schrijven) een pak complexer is.

Analyse van bestaande teksten vinden we terug in Google Translate. Daar gaat de machine op basis van tekstinput vertalen wat het woord zou betekenen in een andere taal. Die evolutie heeft de laatste jaren heel wat stappen voorwaarts gezet.

Als copywriters zijn we bij Scriptorij vooral bezig met tekstcreatie. Nieuwe content schrijven en originele invalshoeken bedenken. Op Talk to Transformer vind je een machine learning tool die zelf de copy schrijft. En inderdaad, die ML-bot schrijft volledig zelf. Het is geen copy-paste van ergens anders op het net. Toch niet letterlijk. Hij is wel getraind op heel veel data op het net, denk aan data terugvinden op Wikipedia, Google, Reddit …

Telkens probeert het model het volgende woord te voorspellen. Na het eerste woord, voorspelt hij het tweede, dan het derde …  Dat alles op basis van wat hij allemaal is tegengekomen. Het geheel is samenhangend in die zin dat hij niet zomaar ad random woorden op een rij zet, maar probeert te achterhalen welk woord op een volgend woord zou volgen.

Maar inderdaad, een volledige paragraaf schrijven die echt goed aan elkaar hangt en een redenering opbouwt – dat is nog niet voor morgen.

Experiment: robot schrijft intro

We namen de proef op de som. We kozen een willekeurige intro van een blogartikel dat we geschreven hadden voor Femma: ‘Zo voorkomt u vakantieziekte’.

Die eerste zinnen lieten we eerst vertalen door Deepl. Van het Nederlands naar het Engels om vervolgens die copy in ML-bot Talk to Transformers te steken. Aan de hand van 2 à 3 zinnen zou de ML-bot voldoende moeten hebben om zelf een tekst te schrijven. Hieronder het resultaat – oordeel zelf maar.

Originele copy in het Nederlands

Zo voorkom je vakantieziekte

Leisure sickness, al van gehoord? Ongeveer een op de dertig kampt hiermee.

Originele vertaalde broncopy in het Engels door Deepl

How to prevent holiday sickness

Leisure sickness, have you heard of it? Approximately one in thirty is struggling with this.

Content generatie door Talk to Transformers

How to prevent holiday sickness
Leisure sickness, have you heard of it? Approximately one in thirty is struggling with this.
 Holiday sickness is a terrible thing and if you have to take time off while working, then your employer really shouldn’t be in charge, if you’re an employer then you should think about how you can help the sickest people in your country. How do you help the sickest people in your country? Well, if they’re from a developing country you’re going to know that they’re not going to have a lot of resources so it isn’t going to be possible to do a lot of things for a lot of people and it’s more about education. It’s a great source of good ideas about how to help the sickest people, if they’re from a developing country then you’re going to need to look at how their local people go about helping them as they can be a source of good ideas here. The one thing it does is it puts you in contact with communities where the people who are really struggling can actually help others that need help. You get a lot of ideas and you can start finding people that can help. The other thing that can help is having the

Je zou kunnen zeggen, dat de eerstvolgende zin nog redelijk goed aansluit bij het begin. Maar verderop ontspoort de copy en gaat het over ‘het helpen van de ziekste mensen in je land’ en ‘de verwijzing naar ontwikkelingslanden’. Terwijl die sprong uiteraard niet de insteek was van de tekst. Wat Scriptorij er dan wel van gemaakt heeft? Hieronder de paragraaf.

Zo voorkom je vakantieziekte

Leisure sickness, al van gehoord? Ongeveer een op de dertig kampt hiermee. De oorzaak van deze ziekte? Vakantie. Je leest het goed. Vakantie kan ziekmakend zijn. Hoe komt dat? En, belangrijk, hoe voorkom je het? We laten enkele experten aan het woord. Met hun deskundig advies geniet je van een welverdiende vakantie. (De volledige tekst lees je hier)

Taal kent vele lagen

Opgepast, Talk to Transformers is nog heel research driven. Je merkt dat het nog niet logisch in elkaar zit en het resultaat is onsamenhangend. De grote uitdaging met taal is dat het enorm gelaagd is. Zo moet de computer de intro verstaan, weten welke relevante info hij daar kan aan toevoegen, context … Vandaag is het nog te moeilijk voor een machine om zelf gegenereerde content te schrijven. En zeker in onze Nederlandse taal.

Template based schrijven

Iets verder gevorderd is de creatie van content in een template. Hoe werkt template based? Mensen hebben al zinnen geschreven, maar dan moet je nog woorden en feiten invullen. De AI krijgt dan woorden, feiten binnen waarbij hij weet wat waar moet komen. Maar het is de mens zelf die de zinnen geschreven heeft, alleen laat hij nog bepaalde plaatsen open. Zo kan een machine op basis van een persbericht de correcte cijfers eruit halen en die in een vooraf geschreven template nieuwsbrief schrijven. Maar een volledige nieuwsbrief schrijven, dat is nog niet voor morgen.

Als de ML bot misschien een betere briefing zou krijgen, dan zou die tekst wellicht altijd maar fijner en fijner samengesteld zijn. Iets voor in de toekomst misschien?

Probeer het zelf via www.talktotransformer.com of www.ai-writer.com

AI AI HOERA!?

Meer van dit? Kom op donderdag 21 november naar AI AI Hoera!? De Scriptorij conferentie over de impact van artificiële intelligentie op copy en communicatie. En Scriptorij bestaat 15 jaar! De plaatsen zijn beperkt. Snel zijn is de boodschap.

Meer lezen? Kom hier alles te weten over