De chatnot - waarom blijven chatbots zo slecht?
In dit artikel:
Vanmorgen liep de columnist tegen de chatbot van zijn verzekeraar aan — Anna — die twee keer niet begreep wat hij vroeg over een door zijn dochter in Spanje beschadigde laptop. Na vruchteloze interacties en een automatische doorverwijzing naar een schadeformulier gaf hij het op en wachtte twaalf minuten aan de telefoon op een menselijke medewerker. Die ervaring is volgens hem representatief: jaren van bots bij banken, verzekeraars, webshops en overheden hebben zelden echt goed geholpen.
Waarom blijven zulke chatbots zo matig presteren? Technisch gezien draaien veel website-bots op starre scripts en beperkte beslisbomen, niet op grote taalmodellen (LLM’s) zoals ChatGPT of Gemini. Die scripts bevatten maar een kleine woordenschat, missen contextbegrip en kunnen niet zelfstandig redeneren of samenvatten. Functioneel zijn de bots vaak ook ontworpen met één doel: kosten besparen en gebruikers snel naar een formulier of webpagina leiden. In de kern functioneren ze als interactieve FAQ’s, niet als natuurlijke gesprekspartners.
Bedrijven gebruiken niet massaal LLM’s vanwege kosten, complexiteit en risico’s. LLM-integratie vergt maatwerktraining op bedrijfsdata, veel rekenkracht en technische implementatie. Bovendien kunnen generatieve modellen soms foutieve of verzonnen informatie geven — onacceptabel voor partijen als verzekeraars of gemeenten. De columnist wijst op concrete incidenten: Air Canada moest schadevergoeding betalen na verkeerd advies van een chatbot, en New York haalde een gemeentebot offline toen die juridisch dubieuze antwoorden gaf.
Toch zijn er verbeteringen mogelijk. Bij inzet van LLM’s zijn maatwerktraining en strikte guardrails nodig om veiligheid en juridische compliance te waarborgen. Ook met beperkte systemen valt winst te boeken: scripts kritisch herzien, testen uitvoeren, content door een copywriter laten checken, eindeloze foutloops verwijderen en vooral een vriendelijke, directe doorverwijzing naar menselijke hulp inbouwen. Acceptatie van beperkingen en een naadloze escalatie naar echte medewerkers vergroten de klanttevredenheid.
De columnist sluit met een praktische noot: hij stuurt zijn observaties naar zijn verzekeraar in de hoop dat Anna dit zomerproject opgeknapt wordt, zodat ze in september behulpzamer is — of op z’n minst vriendelijk en effectief doorverwijst naar een menselijke collega. De illustratie bij de column is gemaakt met ChatGPT.