Spring naar inhoud

Minimalisatie of maximalisatie? Slim omgaan met je data

We kunnen niet meer zonder data. Datagedreven werken maakt intelligent en wendbaar, zo ontdekken steeds meer organisaties. Behalve als je té veel data hebt. Voor ons – we verwerken de pensioendata van bijna 4 miljoen Nederlanders – is dat geen nieuws. Al in de vorige eeuw besloten we slim om te gaan met data. En daar profiteren we nu nog steeds van.

Steeds meer organisaties werken datagedreven. En dat werkt ook in de hand dat organisaties data gaan hamsteren. Zoveel mogelijk data verzamelen, vanuit de gedachte: wie weet dat je er nog iets mee kan. Het is tenslotte het nieuwe goud. Deels is dat goed te begrijpen, vindt Tjapko Struik, datascientist bij TKP. ‘Als je pas data gaat verzamelen wanneer je een concreet doel hebt, ben je te laat. Door bij voorbaat alle binnenkomende data netjes op detailniveau op te slaan, sorteer je voor op toekomstige doelen. Denk aan nieuwe ideeën om de klantbediening te verbeteren, waarvoor je wil leren van gedrag uit het verleden.’

Veel energie nodig

Toch is dat niet de slimste manier van datagedreven werken. Verzamel je meer dan je nodig hebt, zonder een duidelijk beeld van een toekomstig doel, dan ontstaat er een groeiende ongestructureerde datacollectie. Inclusief risico’s als oneigenlijk gebruik van de data, of het risico van verkeerde interpretaties als je steeds meer afgeleide datasets vastlegt. En er is het risico dat, op het moment dat er wel een doel is, de datacollectie verouderd is, of niet meer goed te gebruiken.

Daarnaast zijn er natuurlijk ook juridische beperkingen. ‘Volgens privacywetgeving – de AVG – moet er een doelbinding en grondslag zijn,’ gaat Tjapko verder. ‘Dat betekent dat je persoonsgegevens altijd verzamelt en verwerkt met een specifiek doel, voor een specifieke termijn, en dat je data niet zomaar voor een ander doel kunt vasthouden.’ Een belangrijk principe in de AVG is dataminimalisatie: verzamel en verwerk niet meer gegevens dan noodzakelijk. Dat je terughoudend met data omgaat, vindt ook Bram Schreuder, onlinedata-analist bij TKP, niet meer dan normaal. Wel vindt hij dat je daar niet in door moet slaan. ‘De route van dataminimalisatie kan een erg voorzichtige route zijn,’ stelt hij. ‘En niet altijd in het belang van pensioendeelnemers. Online volgen we bijvoorbeeld gebruikers van de website om te zien of alles goed werkt. Dat doen we wel zonder dat we weten welke gebruiker welke deelnemer is – die gegevens koppelen we dus uit privacyoverwegingen niet. Ook niet ná het inloggen op hun Mijn omgeving, waar ze hun pensioenzaken regelen. Wel loggen we noodzakelijke en doelgebonden activiteiten in databases, bijvoorbeeld voor een beleggingsprofiel of het doorgeven van een e-mailadres.’

Beperking zónder keerzijdes

Wetgeving legt dus al als vanzelf een beperking op. Maar wel een beperking die z’n keerzijdes kan hebben. Hoe gaat een organisatie als TKP, die al zo’n lange geschiedenis heeft met datagedreven werken, nu proactief slim om met data? Zodat slimme minimalisatie en toekomstige wendbaarheid hand in hand blijven gaan? Tjapko: ‘In de jaren ’90 was er in de pensioenwereld de discussie over een feiten- of standenadministratie. De vraag was of je feitelijke data opsloeg, zoals werkuren en salarissen, of de ‘standen’ – de afgeleide gegevens of uitkomsten uit pensioenberekeningen, bijvoorbeeld voor het jaarlijks uniform pensioenoverzicht. Wij besloten een feitenadministratie te hanteren. Dat was toen state-of-the-art technologie, zeker in een tijd dat opslagruimte nog beperkt was. Later bleek het een gouden greep. De data bleven in de decennia daarop namelijk veel schoner. Bovendien raakten we erg bedreven in het gedetailleerd en goed geïndexeerd opslaan van de data, zodat we de feiten later makkelijk konden hergebruiken en samenvoegen tot nieuwe datasets. En bijvoorbeeld veel beter mutaties met terugwerkende kracht konden doorvoeren.’   

In de cultuur

De zorgvuldige en slimme omgang met data zit inmiddels in de cultuur ingebakken. En brengt belangrijke voordelen met zich mee. Tjapko: ‘We verzamelen sinds een paar jaar steeds meer online data vanuit onze websites en campagnes. De offline deelnemersdata uit onze administraties kunnen we, doordat ze zo schoon én gedetailleerd opgeslagen zijn, relatief makkelijk samenvoegen met nieuwe online data. Zolang het een gerechtvaardigd doel en grondslag heeft, natuurlijk. Die datasets gebruiken we voor onze interne dashboards en rapportages.’

Bram: ‘Dat we online en offline data relatief eenvoudig kunnen combineren is belangrijk voor onze communicatieadviseurs. Als pensioenuitvoeringsorganisatie versturen we veel e-mailings naar deelnemers waarmee we ze op belangrijke momenten activeren om noodzakelijke keuzes te maken. Om de mailings en de websites zo effectief mogelijk te maken, baseren de communicatieadviseurs zich op dashboards en rapportages. Daardoor kunnen ze al bij het versturen van de mailings segmenteren op bijvoorbeeld leeftijd of levensfase. Belangrijk, want je wilt jongere deelnemers niet een mailing sturen over keuzes die ze vlak voor pensionering moeten maken. In de toekomst zouden we dergelijke data en dashboards graag nog veel fijnmaziger willen hebben, altijd in het belang van deelnemers. Je ziet dat niet alleen wij, maar veel organisaties hun speelruimte verkennen: wat wel en niet mag.’

Meerdere inkomensscenario’s

Tjapko: ‘Overigens gaan we nu met onze feitenadministratie langzaam óók naar een standenadministratie. Doordat deelnemers op hun Mijn omgeving steeds complexere datasets willen zien – denk aan een pensioenplanner waar ze meerdere inkomensscenario’s kunnen vergelijken – wordt een feitenadministratie te traag. Om flexibel genoeg te kunnen zijn, ontwikkelen we toepassingen als uitbreidingen op de data. De onderliggende databronnen blijven wel als apart domein intact.’

Die decennia aan ervaring met ‘schone data’ halen bedrijven die nu hun datagedreven werken goed willen organiseren, niet zomaar meer in. Hebben Bram en Tjapko desondanks advies hoe nu te beginnen? Tjapko: ‘Sla data pas samengevoegd op als je het ook voor een specifiek doel gaat gebruiken. Maak dus pas op dat moment nieuwe databronnen aan, anders verlies je het overzicht of ben je veel tijd kwijt aan het documenteren van alle afgeleide datasets. Zodra je ‘alvast’ gaat samenvoegen, vanuit het idee dat het in de toekomst wellicht logisch en nuttig is, wordt het een paar weken later al lastig te zeggen of de nieuwe databron nou beter is dan de oorspronkelijke bron. Zo creëer je verwarring. Bovendien weet je bij een volgend project niet meer uit welke bron je nu het beste kunt putten. En op één of andere manier kies je dan altijd de verkeerde. Door zo puur mogelijk op te slaan, blijf je flexibel.’

Verplicht activeren

Een voorbeeld van nieuw gebruik van data is de ontwikkeling van de activatie-index, waarmee TKP wil ontdekken wat de toename in actieve pensioendeelnemers is. Bram: ‘Een deelnemer tellen we als actief wanneer zij of hij het afgelopen jaar is ingelogd op de Mijn omgeving, ons heeft gebeld of naar een videospreekuur is geweest. Bij het versturen van een mailing meten we vervolgens het effect op een groep die dat jaar nog niét actief is geweest. Weet je deze groep te activeren, dan stijgt de totale activatie. Zo krijgt een mailing naast het specifieke communicatiedoel, ook een tweede doel: het meten van de geactiveerde deelnemerspopulatie. Belangrijk nu de nieuwe pensioenwetgeving eraan komt, waarin activerend informeren verplicht wordt.’

Auteurs