Data-analyse en privacy

· 09-04-2020
In Moneybird slaan we de administratie van duizenden ondernemers op. Deze administraties zijn privacygevoelig, daarom leveren we de grootst mogelijke inspanning om deze privé te houden en te beschermen. Tegelijkertijd geven al deze gegevens een uniek inzicht in hoe het met ondernemers in Nederland gaat. In dit artikel leg ik uit hoe we bij Moneybird data-analyse toepassen om tot deze inzichten te komen en hoe we daarbij de privacy van onze klanten garanderen.

Bij het doen van data-analyse nemen we alleen de gegevens mee van klanten die hier expliciet toestemming voor gegeven hebben. Deze toestemming kun je altijd wijzigen via het accountbeheer van je administratie.

Waarom data-analyse? #

De algemene gegevens in een administratie kunnen interessante inzichten geven over ondernemerschap in Nederland. Dit inzicht is uniek omdat we met Moneybird een grote groep kleine ondernemers bedienen. Een beursindex zoals de AEX zegt iets over hoe het met grote bedrijven gaat. Het is net zo interessant om te weten hoe het met kleine bedrijven gaat.

De inzichten die we uit de algemene gegevens van een administratie kunnen halen zijn bijvoorbeeld:

  • Hoe ontwikkelt de gemiddelde betaaltermijn van facturen zich? Zien we een dalende trend of stijgt de betaaltermijn juist?
  • Hoe groeit de gemiddelde omzet van kleine ondernemers ten opzichte van vorig jaar? Welke gevolgen heeft bijvoorbeeld de coronacrisis.
  • Zijn overheidsmaatregelen om ondernemerschap te stimuleren effectief of sluiten ze ondernemers buiten die ook de gevolgen merken van een crisis?

Statistische data-analyse #

Als we data-analyse doen, doen we altijd een statistische analyse. Dit houdt in dat de gegevens bestaan uit geaggregeerde gegevens en niet uit persoonsgegevens.

Neem als voorbeeld de omzet van een onderneming. Deze staat bijvoorbeeld als volgt opgeslagen in onze database:

statistische data-analyse

Het is duidelijk dat dit privacygevoelige gegevens zijn. Maar als we iets willen zeggen over de gemiddelde omzet in een maand, dan hoeven we helemaal niet te weten over welk bedrijf het gaat. Het is dan voldoende om alleen naar deze gegevens te kijken:

overzicht per maand

Op basis van deze gegevens kunnen we aggregatie toepassen, bijvoorbeeld een gemiddelde berekenen. Op basis van de bovenstaande gegevens blijkt dat een bedrijf gemiddeld € 4.750 omzet in een maand heeft. De database die wij gebruiken (PostgreSQL) heeft slimme functies waardoor het gemiddelde berekenen in één keer kan, zonder dat we naar afzonderlijke regels hoeven te kijken. Dat is nog een extra bescherming van de privacy.

Je kunt beredeneren dat een gemiddelde van één bedrijf nog steeds privacygevoelig is. Dat klopt en daarom zien wij er op toe dat we alleen statistieken gebruiken als we voldoende data hebben.

Conclusie #

Ik hoop je zo een goed beeld gegeven te hebben van de data-analyse die we doen bij Moneybird. Deze data-analyses kan ons allemaal van waardevolle inzichten voorzien. Daarom hopen we dat je bereid bent je gegevens met ons te delen zodat we deze data mee kunnen nemen in onze analyses. We gebruiken alleen geanonimiseerde gegevens die nooit te herleiden zijn naar jouw bedrijf of tot jou als persoon. Bovendien verkopen we de gegevens nooit.

Misschien vind je dit ook interessant ...