Dit is Markus. Data scientist bij de Belastingdienst.

man achter laptop kijkt in de camera

‘Na mijn bachelor Natuurkunde en master Econometrie ben ik via via bij de Belastingdienst beland. Iemand die assessments afnam voor de Belastingdienst dacht, hé, iemand met zo’n profiel kunnen ze bij de afdeling Data & Analyse wel gebruiken. En hier zit ik dan. Al een jaar of twee, naar volle tevredenheid.

Verschillende werkzaamheden

En dat wordt voornamelijk veroorzaakt doordat ik me alle kanten op kan ontwikkelen. Momenteel ben ik werkzaam als data scientist binnen de afdeling van de ad hoc-analyses. Dit betekent natuurlijk dat je ad hoc vragen beantwoordt, maar de diversiteit binnen die vragen is enorm en kunnen uit verschillende richtingen komen. Uiteraard direct vanuit de Belastingdienst, maar ook vanuit de AFM, het Ministerie van Financiën, de Tweede Kamer en de Wet openbaarheid van bestuur. Als je als burger vragen hebt over het handelen van de overheid, kun je een Wob-verzoek indienen. Als dat verzoek is gericht op cijfers, dan kan het voorkomen dat wij die vraag uitzoeken.

Datalead van een datafundament

Binnen het beantwoorden van die vragen heb ik weer een diversiteit aan werkzaamheden. In het begin werkte ik ook meer aan een datafundament, dat wil zeggen de brondata zo opwerken dat je er betrouwbare analyses en robuuste producten mee kunt maken. Ik ben nog steeds datalead van een klein datafundament. Dit betekent dat je er verantwoordelijk voor bent én eerste aanspreekpunt. Mijn deel heeft te maken met werkstroombesturing. Ik zorg ervoor dat de informatie uit dit datafundament bij de juiste personen terechtkomt en ik beantwoord vragen als die er zijn.

'Soms bedenk ik op de fiets naar huis een query die ik de volgende dag draai op 60 miljard records.'

Presentatie

Presenteren over de werkzaamheden van D&A

vergadering

Gezamenlijk vraagstukken uitpluizen

kantoor met bureau en 3 mannen

Werkvoorbereiding met D&A-collega’s

Inzichten uit analyses

Daarnaast ontwikkel ik informatiedashboards en maak ik keten- en procesanalyses. Bijvoorbeeld voor de omzetbelasting. Als een bedrijf geen aangifte doet maakt de Belastingdienst een schatting van de verschuldigde belasting. Uit analyses die ik heb gemaakt blijkt dat dit proces niet optimaal verloopt voor sommige doelgroepen. Met de producten die we ontwikkelen bij D&A geven we meer inzicht in onze klanten en kunnen onnodige en onjuiste schattingen voorkomen worden.

Zelf je projecten kiezen

Mijn werkzaamheden verschillen behoorlijk. En dat maakt het interessant. Vaak mag je zelf kiezen bij welk project je betrokken wilt zijn. Die projecten variëren van effectmetingen (leveren onze projecten wat op?) tot het ontwikkelen van risicomodellen (waar moeten we meer of juist minder controleren?). Hierbij gebruiken we moderne analysetechnieken zoals gradient boosting en neurale netwerken.

Concrete producten

Hiermee leveren we concrete producten op voor de business zoals we dat noemen. Een daarvan is bijvoorbeeld het dynamisch monitoren. Als de Belastingdienst geld te goed heeft van iemand die na meerdere waarschuwingen nog niet heeft betaald, kan er over worden gegaan tot inbeslagname. Maar als iemand niets heeft… Vroeger werd er dan na een tijdje nog een keer handmatig gepeild of er op dat moment nog steeds niets te halen viel. Nu gebeurt dat dynamisch. Het systeem geeft vanzelf een melding als iemand weer een baan heeft of een auto aanschaft. Zodat er automatisch duidelijk wordt wanneer er geïnd kan worden. Want iedereen moet Belasting betalen voor het maatschappelijk belang. Dat vind ik een prettige bijkomstigheid, maar dat maatschappelijke belang was voor mij niet dé reden om dit werk te gaan doen.

groepsfoto skieen

Met z’n allen op wintersportvakantie

vakantiefoto

Teamuitje: escape room

Afdeling in ontwikkeling

Vooral de veelzijdigheid van projecten, de afdeling die enorm in ontwikkeling is en de vele oplossingen die nu nog niet ontdekt zijn, maken het echt tot een heerlijk vak op een leuke plek. Want dat is het binnen D&A binnen de Belastingdienst. De sfeer is top, collega’s gaan heel leuk met elkaar om en ondernemen veel. Daarnaast kun je SQL-query’s draaien op de Terradata server in Apeldoorn waarmee je binnen mum van tijd antwoord krijgt op je vraag, terwijl er in de tussentijd 60 miljard records zijn geraadpleegd. Bizar toch?

Grote impact

En dat doe je niet voor niets. Want de impact van de dingen die we hier ontwikkelen is enorm. Kleine slimmigheidjes die we via SAS uitvragen leveren al besparingen op van vele miljoenen. En dit alles doen we uiteraard wel met een PIA: een privacy impact assessment, want ook daar moeten we elke dag op inspelen. Welke gegevens mogen we voor welk doeleinde gebruiken? Zo zijn we bijvoorbeeld veel bezig met het pseudonimiseren van data: de eindgebruiker kan dan alleen aflezen wat hij eraan af zou moeten lezen en niet meer.

Zoals je merkt houd ik me met veel verschillende werkzaamheden bezig en mijn nieuwsgierig is nog niet bevredigd, dus ik blijf hier in elk geval nog wel even zitten.’