Corona experten en beleidsmakers: de tovenaarsleerlingen van de regeltechniek

Herwig Mannaert
5 mrt 2023
13 minuten om te lezen

Auteur: Herwig Mannaert, Gewoon hoogleraar systeemtheorie en beleidsinformatica, Universiteit Antwerpen

Zowel voor het verantwoorden als bekritiseren van beleidsmakers en experten in de pandemie werden reeds tal van argumenten en invalshoeken gebruikt. Een analyse vanuit systeemtheorie en regeltechniek lijkt tot dusver amper aandacht te hebben gekregen. Nochtans zagen experten en beleidsmakers hun maatregelen in het algemeen, en de coronabarometer in het bijzonder, als een manier om bepaalde waarneembare parameters – zoals het aantal besmettingen en hospitalisaties – actief te sturen. En dus begaven ze zich de facto op het domein van de regeltechniek, een vrij uitdagende ingenieursdiscipline, zeker indien men een complex systeem wil sturen of regelen.. In deze bijdrage kijken we dan ook naar het pandemiebeleid door de lens van de regeltechniek. Deze analyse is in eerste instantie exploratief, maar wijst toch duidelijk in dezelfde richting als een aantal andere analyses. De conclusie dringt zich ook hier op dat de aanpak vernauwend was, en dat de relevantie van virologie vaak erg beperkt was in vergelijking met andere disciplines – zoals de regeltechniek – die zelfs helemaal niet aan bod zijn gekomen.

Het basisschema van een regelsysteem wordt voorgesteld in onderstaande figuur, en is gebaseerd op een erg eenvoudig principe: men wil een grootheid Y sturen op basis van een gewenste referentiewaarde R.

De te sturen grootheid Y kan bijvoorbeeld de temperatuur van een kamer zijn, of de snelheid of bewegingsrichting van een auto. De sturing is gebaseerd op de zogenaamde negatieve terugkoppeling: het stuursignaal zal gebaseerd zijn op het verschil tussen de gewenste waarde en de echte waarde. Zo zal het aansturen van de verwarming of motor bepaald worden door het verschil tussen gewenste en gemeten temperatuur of snelheid, en het draaien van de wielen door het verschil tussen gewenste en gemeten oriëntatie. Dit verschil telt zowel in grootte als richting, aangezien een kleinere gewenste waarde een negatieve sturing impliceert. Naast het eigenlijke fysische proces dat men wil sturen, zoals de brander in een verwarmingsinstallatie die de kamertemperatuur beïnvloedt, onderscheidt men hier ook twee zogenaamde fysische omzetters: een meter die bijvoorbeeld een temperatuur in een meetwaarde omzet, en een actuator die een bepaalde stuurwaarde in bijvoorbeeld een daadwerkelijke verbranding omzet. Links hebben we dus te maken met abstracte waarden of getallen, rechts met fysische grootheden.

Cruciaal in systeemtheorie en regeltechniek is dat elk van deze onderdelen of blokken een gedrag in de tijd heeft, en dus een bepaalde dynamiek met zich meebrengt. Een stuursignaal nu kan ook nog later invloed hebben op de uitgangswaarde, en m.m., de uitgangswaarde nu kan ook nog invloed ondervinden van stuursignalen van het (nabije) verleden. Het niet onderkennen van dit dynamisch gedrag kan tot heel vervelende effecten leiden. Zo heeft een verwarmingsinstallatie steeds een bepaalde vertraging, en het niet beseffen hiervan zou kunnen leiden tot een veel te sterke sturing. Dit zou dan weer aanleiding kunnen geven tot een onnodig krachtige verbranding, wat op zijn beurt kan resulteren in een veel te grote opwarming of overshoot. Zo zou een systeem sterk kunnen beginnen oscilleren of slingeren. Bij het automatisch besturen van een auto zou dit kunnen leiden tot heen en weer slingeren op de weg. Daarom voorziet men in een regelsysteem tevens een zogenaamde regelaar, die op basis van het dynamisch gedrag van de andere bouwblokken deze ongewenste dynamische effecten moet tegengaan.

Laten we dit basisschema eens toepassen op de sturing van de pandemie. De grootheid die men wil sturen is het aantal besmettingen Y en/of ziekenhuisopnames Z. Op basis van het verschil met een gewenste waarde zullen maatregelen genomen worden. Het nemen van deze maatregelen, al dan niet automatisch op basis van een zogenaamde barometer, is de regelaar van het regelsysteem. De uitvoering van de maatregelen door de bevolking komt overeen met de actuator. Doel hiervan is het aantal ‘besmettings-vatbare contacten’ X te beperken, wat verondersteld wordt de besmettingen aan te sturen. Er zijn ook storingen bij die aansturing, aangezien deze maatregelen niet volmaakt (kunnen) nageleefd worden. In het eigenlijke systeem. i.e., de menselijke interacties, leiden dan de besmettings-vatbare contacten X tot een aantal besmettingen Y. Deze besmettingen leiden vervolgens tot een aantal ernstige gevallen, geformaliseerd door het aantal ziekenhuisopnames Z. Aangezien het hier gaat om twee stappen, met in het algemeen eigen karakteristieken en parameters, wordt dit in regeltechniek typisch als een apart systeem of blok weergegeven.

Zowel het aantal besmettingen als ziekenhuisopnames kan gemeten worden, en vergeleken worden met bepaalde referentiewaarden om als stuursignaal voor de maatregelen te fungeren. In de regeltechniek poogt men voor de verschillende blokken van het systeem een zogenaamde transferfunctie of overgangsfunctie op te stellen. Een dergelijke functie beschrijft de omzetting van ingang naar uitgang, en wordt afgeleid vanuit een model dat een relatie tussen ingang en uitgang weergeeft. Het doel van de analyse in de regeltechniek is om de werking van het systeem als geheel beter te vatten, en een aantal ongewenste effecten te mitigeren. Zo willen we ook in deze bijdrage verkennen of we op basis van een aantal karakteristieken van mogelijke verbanden tussen deze grootheden, een aantal geobserveerde fenomenen kunnen beschrijven en zo mogelijk in de toekomst mitigeren.

Vooreerst valt op dat de terugkoppeling van het hele systeem een zeer aanzienlijke tijdsvertraging bevat. Zelfs indien maatregelen ogenblikkelijk zouden ingaan en nageleefd worden, zal de incubatietijd van een besmetting nog steeds voor een vertraging van ongeveer een week zorgen. Ook de meting zal minstens voor een vertraging van 1 tot 2 dagen zorgen. Een doorlooptijd in de systeemcyclus van ongeveer 10 dagen is in de regeltechniek een eeuwigheid. Om bij grote vertragingen toch snel genoeg op de bal te spelen, maakt men vaak gebruik van een differentiërende component in de regelaar, dit wil zeggen dat men niet alleen op het verschilsignaal stuurt, maar ook op een verandering ervan. Concreet wil dit zeggen dat men niet alleen op het aantal besmettingen stuurt, maar ook op de stijging ervan. Dit is echter gevoelig voor fluctuaties die mogelijk helemaal niet significant blijken te zijn, en kan het belangrijkste gevaar van tijdsvertragingen nog versterken: grote vertragingen kunnen namelijk aanleiding geven tot overreactie of ‘overshoot’ en zelfs oscillaties. Omdat de impact van sturing niet meteen effect heeft, kan het niet onderkennen van vertragingen verleiden tot onnodig krachtige of zelfs brutale sturing. Het is ook niet evident – en zelden zinvol – om de sturing sneller te veranderen dan de doorlooptijd, i.e., de maatregelen al na een paar dagen opnieuw te veranderen. Op deze wijze wordt een sturing immers gewijzigd voordat deze een uitwerking heeft. Het wordt dan ook heel lastig om inzicht te verwerven in de werking van de maatregelen, aangezien de effecten van verschillende maatregelen door elkaar heen vloeien.

Kijken we eerst naar het primaire systeem, de “besmettings-vatbare” contacten die tot een aantal nieuwe besmettingen leiden. Dit systeem is noch lineair, i.e., het aantal besmettingen is niet gewoon evenredig met het aantal vatbare contacten, noch tijdsinvariant, i.e., het gedrag van het systeem is niet identiek op elk moment in de tijd. In de systeemtheorie spreekt men van een complex adaptief systeem, dat in het algemeen een complex dynamisch gedrag vertoont en moeilijk te analyseren is. We kunnen aannemen dat het aantal nieuwe besmettingen Y op dag k, i.e., Y[k], in principe evenredig is met het product van het aantal “besmettings-vatbare” contacten X op dag k, i.e., X[k], en het aantal besmettelijke personen op dag k. Dit aantal kunnen we ruwweg voorstellen als het aantal personen dat recent besmet werd, bijvoorbeeld tijdens de laatste week, i.e., Y[k-1] tot Y[k-7]:

Een dergelijk verband lijkt tot een exponentieel stijgende functie te leiden, een ronduit beangstigende stijging die de vaak paniekerige reactie kan verklaren om met harde maatregelen het aantal besmettings-vatbare contacten X[k] krampachtig naar beneden te krijgen. Maar dergelijke exponentiele stijging kan natuurlijk niet lang doorgaan omdat je slechts een eindig aantal mensen T hebt. Meer nog, je kan de mensen die al besmet zijn niet meer besmetten, en evenmin de mensen die recent besmet en genezen zijn. Dus moeten we hier minstens een correctiefactor invoeren, waarbij we bijvoorbeeld de mensen die de laatste zes maanden besmet zijn, i.e., Y[k-1] tot Y[k-180], als niet besmettelijk beschouwen.

Het is niet de bedoeling om hier in te gaan op de duur van deze bescherming door natuurlijke immuniteit, die een ruwe schatting is en in de realiteit trouwens eerder geleidelijk en niet abrupt afneemt. Dit neemt niet weg dat het in kaart brengen van deze functie, in regeltechnische termen de immuniteitsresponsie, cruciaal lijkt voor het opstellen van zinvolle modellen. Het is echter vooral belangrijk om te beseffen dat dit effect het dynamisch gedrag van Y[k] een stuk complexer maakt dan de ogenblikkelijke waarden van besmettingen en contacten. Dit betekent dat een golf die plots snel begint te groeien misschien wel angstaanjagend is, maar tegelijk zelf zijn afvlakking met zich meebrengt omdat er steeds minder mensen besmet kunnen worden. Vergeten we immers niet dat het aantal reële besmettingen in het algemeen nog een stuk groter is dan het aantal gemeten besmettingen. En dus moeten we oppassen met te panikeren op basis van de zogenaamde “R-factor”, het gemiddeld aantal personen dat door een besmet persoon wordt besmet, omdat deze factor niet alleen bijdraagt tot de groei van een golf, maar iets later ook tot het uitdoven ervan. Dit neemt uiteraard niet weg dat het zinvol of nodig kan zijn om, zoals men in het begin van de pandemie vooropstelde, de golf van besmettingen te willen afvlakken om de capaciteit van het zorgsysteem niet te overschrijden. Dit welbekende “flatten the curve”, hieronder links voorgesteld, werd in het begin van de pandemie aangewend als strategie. Een op zich logische strategie, ook al lijkt de capaciteit van het zorgsysteem slechts zeer zelden overschreden te zijn, zelfs in landen met erg beperkte maatregelen. Gaandeweg ging dit echter over naar het per se willen onderdrukken van elke golf. Deze strategie, hieronder rechts voorgesteld, is eigenlijk een “self-defeating prophecy” en ging ervan uit dat een golf zonder strenge maatregelen onbeheersbaar zou worden.

Het is ook niet de bedoeling om hier in te gaan op deze veronderstelling, waarvan de validiteit ernstig in vraag kan worden gesteld op basis van de landen die geen uiterst strenge maatregelen hadden en toch geen onbeheersbare golf kregen. Waar we wel de aandacht op willen vestigen, is dat het hard neerslaan van een zich ontwikkelende golf, met bijvoorbeeld lockdowns, een zeer ongelukkige dynamiek op gang kan brengen. Bij deze “interrupt the curve” strategie, zet je immers het zelf-beperkend karakter van een golf buiten spel door vele mensen niet in aanraking te laten komen met het virus. Ook de grote groep gezonde jonge mensen, die van Covid-19 vrijwel niets te vrezen hebben, bouwen dan geen immuniteit op, en vormen zo een rijke voedingsbodem voor de volgende golf. Meer nog, de immuniteit van de mensen die wel besmet en genezen zijn, zal – zonder hernieuwd contact met het virus – twee of drie golven later vervaagd zijn, zodat ook zij opnieuw beschikbaar worden om als voedingsbodem voor een nieuwe golf te fungeren. Met andere woorden, het overdreven optreden om een golf af te breken voor die uit zichzelf zou uitdijen, kan in principe leiden tot de in de regeltechniek zo gevreesde oscillaties, wat in dit geval zou neerkomen op het steeds weer ontstaan van periodieke nieuwe golven. Dit mogelijk effect van “repeat the curve” wordt hieronder schematisch voorgesteld.

Daarnaast spelen ook andere factoren mee bij een mogelijke infectie, zoals de weerstand of fitheid van de mensen. Die kunnen we vereenvoudigd voorstellen met een gemiddelde gevoeligheid G[k]:

Zo is het algemeen geweten dat elementen als beweging, buitenlucht, een gezonde voeding en opgewekt humeur kunnen bijdragen aan de natuurlijke weerstand, en zo de gevoeligheid voor besmettingen kunnen verlagen. Merkwaardig genoeg werd dit belangrijk aspect van het systeem nooit benadrukt, en zelfs verwaarloosd, in de overvloedige communicatie tijdens de pandemie. Meer nog, in dit adaptief systeem worden de karakteristieken van het systeem zoals de gemiddelde gevoeligheid G[k], mee beïnvloed door de sturing of maatregelen. Dit adaptief effect van het systeem lijkt nooit in acht genomen te zijn en was doorgaans negatief, i.e., leidde namelijk tot een grotere gevoeligheid. We vermelden hier bijvoorbeeld het opsluiten van mensen wat vaak tot overmatig eten en drinken leidt, het ontmoedigen van beweging in gezonde lucht door allerlei regels en mondmaskers, het systematisch wegen op het humeur van mensen door niet aflatende communicatie over onrustwekkende cijfers, en het laten toenemen van gevoelens van depressie en angst door de sociale isolatie. Hierbij mogen we niet vergeten dat eenzaamheid in het algemeen geassocieerd wordt met verminderde immuniteit voor infecties.

Het tweede systeem, het overgaan van infecties naar een aantal meer ernstige vormen met hospitalisatie, is vrij gelijkaardig. Als we ervan uitgaan dat een ernstige ontwikkeling zich typisch voordoet binnen de tien dagen na infectie, kunnen we ruwweg stellen dat het aantal nieuwe ernstige gevallen Z op dag k, i.e., Z[k], evenredig is met het totaal aantal besmettingen van de laatste twintig dagen: Y[k-1] tot Y[k-20].

Ook hier moeten we uiteraard een correctie toepassen voor het de mensen die recent besmet en genezen zijn. Het is opnieuw allerminst de bedoeling om hier een standpunt over de aard en duur van immuniteit in te nemen, maar het lijkt niet ondenkbaar dat de bescherming tegen ernstige complicaties door een eerdere infectie langer duurt dan de bescherming tegen infectie zelf. En dus zouden we bijvoorbeeld kunnen veronderstellen dat mensen die tussen 6 en 18 maanden geleden zijn hersteld, i.e., Y[k-181] tot Y[k-540], wel opnieuw besmet kunnen worden, maar nog niet (opnieuw) ernstig ziek kunnen worden.

Nogmaals, ook hier is het niet de bedoeling om een standpunt in te nemen over de duur van deze immuniteit, die trouwens eveneens geleidelijk en niet abrupt zal afnemen. Maar ook hier is het belangrijk om de mogelijke complexiteit van het dynamisch gedrag aan te geven, waarbij de duur van immuniteit tegen besmetting en ernstige ziekte kunnen verschillen, en waarbij ook deze laatste immuniteit zal vervagen bij aanslepende golven. En uiteraard speelt ook hier een gemiddelde gevoeligheid G[k] op basis van algemene fitheid en weerstand een rol. Hoewel licht anders van aard, zal deze gevoeligheid gelijkaardig zijn aan die in relatie tot besmetting. In dit geval lijkt het ook redelijk een factor F[k] in te voeren voor de mate waarin men selectief meer kwetsbare mensen heeft kunnen afschermen van infectie, de zogenaamde “focused protection”. En ook de eventuele werking van vitamines en therapeutische medicijnen kan hier mogelijk een belangrijke rol spelen, die we weergeven in de vorm van een factor E[k]. Bij deze factor dient zeker de rol van de huisartsen te worden vermeld, die met de gepaste aanpak van patiënten de kans op ziekenhuisopname kunnen verminderen.

Net als bij het eerste systeem merken we op dat er heel weinig tot niet is ingezet op deze drie potentieel belangrijke factoren, en dat de actuator, i.e., de maatregelen, in het algemeen een vrij sterke negatieve invloed lijken gehad te hebben op de gevoeligheidsparameter G[k] van dit adaptief systeem.

Wat gebruikt wordt om de sturing te bepalen is natuurlijk niet het aantal besmettingen, maar het aantal gemeten besmettingen. Bij de meter geldt een vertraging van 1 tot 2 dagen voor de analyse van de test, gecombineerd met een mogelijke additionele vertraging doordat mensen zich niet onmiddellijk laten testen. We kunnen dus ruwweg stellen dat de meting van het aantal besmettingen M op dag k, i.e., M[k], evenredig is met het gemiddelde van het aantal besmettingen van pakweg de laatste 5 dagen.

Het spreekt vanzelf dat ook hier een correctiefactor moet worden toegepast omdat niet alle besmettingen ook daadwerkelijk gemeten worden. Vele besmette mensen, zeker diegenen die asymptomatisch zijn, laten zich immers niet vrijwillig testen. Maar deze correctiefactor V[k] is ook in hoge mate afhankelijk van de teststrategie, het al dan niet asymptomatisch testen van scholieren of terugkerende vakantiegangers kan een enorme impact op het meetresultaat hebben. Deze impact is sterk variabel in de tijd, en bepaalt toch mee de maatregelen. Tenslotte moeten we ook een correctiefactor W[k] in acht nemen voor de aanzienlijke hoeveelheid foute testen, voornamelijk “false positives”. Deze factor lijkt constant in de tijd, maar kan desalniettemin sterk variëren op basis van het aantal cycli dat de laboratoria gebruiken. En ook dit zit mee in het stuursignaal dat gebaseerd is op de meting M en niet op de echte waarde Y.

De regelaar vervolgens moet de regelkring op gepaste wijze laten omgaan met het dynamisch gedrag, zoals tijdsvertragingen van de verschillende blokken, en zo de ongewenste effecten mitigeren. We hebben gezien dat de grote vertragingen een gevaar inhouden om te laat op de bal te spelen, en het beschouwen van stijgingen naast absolute waarden om dit te beperken is inderdaad gebeurd. Maar de andere problemen die met dergelijke vertragingen gepaard gaan, en nog versterkt worden door het gebruik van stijgingen, lijken nooit te zijn geadresseerd, en zelfs niet beschouwd te zijn. Het lijkt niet uit te sluiten dat dit het besproken gevaar voor oscillaties, i.e., steeds weerkerende golven, in de hand heeft gewerkt. Het is niet de bedoeling van deze bijdrage om te onderzoeken of dit daadwerkelijk heeft plaatsevonden, wat immers een complexe studie zou vergen. Wel kan iedereen makkelijk op Google voor de verschillende landen het verloop van het aantal besmettingen in de tijd raadplegen. Hierbij lijkt op het eerste zicht dit weerkerend karakter inderdaad sterker voor te komen in landen met strenge maatregelen, zoals Duitsland en België, dan in een land met minder strenge maatregelen als Zweden.

Tot slot zijn we bij de actuator beland, waar de maatregelen moeten leiden tot een beperking van het aantal “besmettings-vatbare contacten” X op dag k, i.e., X[k]. Het is duidelijk dat dit verband het minst duidelijk te kwantificeren is. Idealiter zouden de maatregelen, zoals afstand houden en mondmaskers dragen, het aantal besmettings-vatbare contacten tot nul moeten reduceren. Terwijl de realiteit uitwijst dat dit wel heel erg lastig en misschien wel onmogelijk is, willen we ons kijkend vanuit de regeltechniek beperken tot enkele overwegingen. Hogere nauwkeurigheid leidt steeds tot een grotere gevoeligheid voor storingen, en dat geldt ook voor erg strenge maatregelen. Immers, elk bewust of accidenteel moment van onoplettendheid krijgt plots relatief grote gevolgen. Daarnaast lijkt het besmettings-vatbaar zijn van een contact ook eerder gradueel dan binair te zijn. Dit kan bijvoorbeeld een negatieve invloed hebben op een lockdown bij een reeds aanzienlijke besmettingsgraad. Mensen die heel de dag hun huis niet mogen verlaten krijgen plots een veel intensiever contact met huisgenoten, daar waar ze voorheen misschien eerder beperkt aerosolen uitwisselden. Met andere woorden, huiselijke contacten zouden plots meer besmettings-vatbaar kunnen worden. Maar dit alles lijkt verwaarloosbaar ten opzichte van het echte probleem van deze actuator, de koppelingen en neveneffecten. We hebben reeds aangegeven dat deze actuator, i.e., de maatregelen, een negatieve impact hebben op de parameters van het complex adaptief systeem zelf, doordat de maatregelen de gevoeligheid G[k] beïnvloeden. Daarnaast heeft deze actuator, i.e., de maatregelen, ook een aanzienlijk effect op andere systemen buiten de beschouwde regelkring.

We vermelden bijvoorbeeld het mentaal welzijn van jonge mensen, het oplopen van leerachterstand, het onderuit halen van de economie, de creatie van schulden voor de volgende generatie, enzovoort. Het gaat hier vrijwel steeds om effecten die een negatieve invloed hebben op menselijk welzijn en gezondheid. Vanuit een regeltechnisch perspectief is dit dramatisch. Het is alsof een verwarmingsinstallatie de muren beschadigt, of de motoren van alle wagens olie op de wegen laten lopen. Wat dit tegelijk heeft laten gebeuren en extra erg maakt, is dat vrijwel al deze negatieve effecten een zeer grote vertragingstijd hebben. Dit wil zeggen dat de schade ervan niet meteen zichtbaar wordt, maar ook niet meer kan gestopt worden eenmaal op gang gebracht. Het uitgesteld karakter van deze neveneffecten als excuus gebruiken voor het negeren ervan staat wel in zeer schril contrast tot het principe “Gouverner, c'est prévoir”.

Indien we het gehele systeem beschouwen valt onmiddellijk op dat de focus en aangewende expertise tijdens de pandemie wel heel erg vernauwend was. Het ging steeds over de beperking van het aantal besmettings-vatbare contacten om het aantal besmettingen te beperken. Bij het aantal besmettings-vatbare contacten werd een vrij theoretisch model gehanteerd, zoals in een labo, zonder veel rekening te houden met de immense storingen in een reële samenleving. Het aantal besmettingen werd enkel ogenblikkelijk beschouwd, geduid met de beruchte R-factor, zonder naar de dynamiek in de tijd te kijken. Additionele factoren, zoals de algemene gevoeligheid of gerichte bescherming, lijken wel genegeerd te zijn. En de invloed op andere systemen, de vele negatieve neveneffecten van de maatregelen op allerhande domeinen, zelfs op de menselijke gevoeligheid voor besmettingen en ernstige ziekte zelf, werden helemaal niet beschouwd. We stellen dus vast dat experten en beleidsmakers zich begaven op het domein van de systeemtheorie en regeltechniek zonder zich bewust te zijn van de elementaire beginselen van deze discipline. Op deze wijze hebben ze een aantal zaken op gang gebracht zonder de gevolgen ervan te begrijpen. Ze zijn als het ware de tovenaarsleerlingen van de regeltechniek.

Corona experten en beleidsmakers: de tovenaarsleerlingen van de regeltechniek

Recente blogposts

Opmerkingen