PERCA Security & Investigations

De wereld van Big Data.

×

Wat is dat?

Ik kan u geen vaste definitie van Big Data geven. Big is natuurlijk een relatief begrip. Hoe bereken je de omvang? Bereken je het aan de hand van de benodigde opslagruimte? Of aan de mate waarin het geanalyseerd kan worden? Ooit was de basis voor data uitgedrukt in Kb’s en tegenwoordig is PetaByte niet ongewoon (1 Petabyte = 1000 Terabyte). De beschikbare Data bestaat in allerlei vormen, zoals getallen, plaatjes, tekst, audio, video, enzovoort. Alle gedigitaliseerde informatie kan worden geanalyseerd. 

Een voorbeeld om Big Data in beeldend perspectief te plaatsen is het opslagsysteem van het KNMI. Dit systeem bevat meer dan 3.7 PetaByte aan meteo-gegevens. Dat is gelijk aan 74 miljoen dossierkasten gevuld met geprinte tekst.

Al jarenlang worden enorme hoeveelheden gegevens verzameld over u en mij. Facetten als gedrag, houding, sociale positie, voorkeuren, aankopen, gemoedstoestand, politieke voorkeuren en ontelbaar meer soorten gegevens die voor de juiste belanghebbende veel waard zijn.

Waarom Big Data?

Een voorbeeld van een marktpartij die verzot is op Big Data is bijvoorbeeld een verzekeraar. Een verzekeraar wil weten welk risico zij verzekerd. Hiervoor heeft deze risicodrager informatie nodig om een inschatting te kunnen maken van zijn financiële risico en haalbaarheid van een verzekeringsproduct. Een belangrijke rol in het bepalen van voorwaarden op dit risico ligt op het bureau van een actuaris. Een actuaris speelt een belangrijke rol in de ontwikkeling van verzekeringsproducten, want zij stellen de verzekeringspremies vast en adviseren over acceptatiebeleid. Hiervoor heeft een actuaris Big Data nodig en natuurlijk de juiste data. Uiteraard is data in een later stadium nodig om voortgang te monitoren en te kunnen anticiperen op ontwikkelingen in het verzekerde domein.

Door de gegevens te analyseren bepaald een verzekeraar hoeveel premie moet worden ingezet voor de middellange en lange termijn om het risico te dekken voor zowel de verzekeraar als de verzekeringnemer. Uiteraard heeft een verzekeraar ook externe verplichtingen tot verantwoording van zijn product en voorwaarden naar de klant, toezichthouder, overheid en andere “stakeholders”.

Data van één klant is leuk maar heeft weinig tot geen betekenis. Onze gegevens kunnen een enorm spectrum beslaan en op voorkeuren van voeding, reizen, eetgedrag, sport, woonomgeving, risicovolle activiteiten (Bungeejumpen op vakantie), rijgedrag, enzovoort worden geselecteerd. Hieruit wordt een risicoprofiel gedistilleerd en maken de verzekeraars (ook banken) een profiel met bijbehorende cijfers. Een term als sterftekans is gekoppeld aan oudedagsvoorzieningen (verzekering), levensverzekering, autoverzekering, enzovoort. Hiervoor is een kritische hoeveelheid data nodig om berekeningen te kunnen uitvoeren die voor een specifiek product en klantengroep representatief zijn en voldoende houvast geeft voor een betrouwbaar product op de lange termijn.

En mijn privacy?

In Nederland zijn strikte normen opgesteld m.b.t. het verzamelen van gegevens. Hiermee is natuurlijk elke belanghebbende gebonden aan bijvoorbeeld de gedragscode verwerking persoonsgegevens. Dikwijls branche-gebonden. Door het feit dat een persoon een overeenkomst/ contract heef met bijvoorbeeld een verzekeraar gelden afwijkende regels m.b.t. Privacy. Bepaalde gegevens mogen door verzekeraars verwerkt worden onder strikte voorwaarden zodra het bijvoorbeeld medische gegevens betreft. Tenslotte moeten de kosten voor huisarts, medicatie, ziekenhuis worden verwerkt met bijbehorende verantwoording.

Ondanks het feit dat banken en verzekeraars enorme hoeveelheden data verwerken, kunnen ze door effectiever gebruik van Big Data toch 210 miljard dollar per jaar besparen (bron; onderzoek McKinsye). Deze besparing kan o.a. betekenen dat er lagere premies aan de klant hoeven worden gevraagd. In het algemeen zijn datastromen het snelst groeiende onderdeel van de hele internationale handel geworden.

Ik moet opmerken dat dit fenomeen niet alleen van de moderne tijd is. Sinds de oorsprong van bijvoorbeeld banken en verzekeraars is de wet van de grote getallen leidend. Zoals altijd is er een kritieke massa nodig om effectief te kunnen zijn en rendabel te kunnen worden in productontwikkeling en klantbelang.

Geld verdienen aan Data.

Wereldwijd, dus ook In Nederland bestaan er informatiemakelaars die u en mijn gegevens verwerken en verhandelen. Zodra wij deze gegevens beschikbaar stellen (lees o.a. toestemming d.m.v. het invullen van formulieren, aanvinken cookies en ons bezoek /gedrag op websites, enz.) is er ergens een partij die deze gegevens verwerkt en wellicht verkoopt of ruilt. U overhandigd dus uw gegevens aan “derden” die zeer dikwijls uw gegevens verkopen aan opkopers.

De grote voorbeelden hierin zijn partijen als Google, Amazon, Bing en Yandex. Dergelijke zoekmachines draaien op het verzamelen van gegevens en het anticiperen op gegevens. Algoritmes zijn complex en dikwijls bewust ontworpen op het verwerken en vervolgens sturen van dezelfde consument die deze gegevens beschikbaar stelt. U kunt zich voorstellen dat we hiermee  ons eigen aanbod en vraag creëren. Wij worden massaal gemanipuleerd zonder dat we ons ervan bewust zijn. We denken dat we zelfs kiezen bij online aankoop maar op subtiele wijze worden onze hersenen via sluikse methodes gemanipuleerd.

Hoeveel en hoe snel?

De hoeveelheid en snelheid van verwerking van de beschikbare data is echter tegenwoordig bijna niet in cijfers uit te drukken. U en ik, stellen deze data (gratis) beschikbaar door o.a. website bezoek, of- en online aankoopgedrag, Sociale Media en het invullen van allerhande online formulieren. De datastroom vind in de zeer nabije toekomst plaats via bijvoorbeeld geprepareerde glasvezelkabels, die via Quantum Internet (nieuwe generatie internet) en kleine Quantum computers onvoorstelbaar grote hoeveelheden data met Quantumversleuteling (niet te onderscheppen data) laat verwerken. De hoeveelheid data is nu te groot voor bestaande systemen om snel en veilig te verwerken.

Het is met de huidige techniek te eenvoudig om data te onderscheppen en feitelijke te lezen/ manipuleren /verkopen of welke activiteit ook. We zullen in de toekomst via dergelijke systemen verregaand kunnen afbreken en opbouwen via dezelfde techniek. Reizen via het Quantum Internet is de toekomst.

Talloze informatiemakelaars verhandelen deze “nieuwe” grondstof voor behoorlijke sommen geld. Zowel in het legale als in het illegale circuit. De afgelopen twee jaar is er meer data geproduceerd dan in de hele geschiedenis van de mensheid. Als u dit leest wordt er per individu elke seconde 1,7 megabytes aan data gegenereerd. Alleen op Google worden 3,5 miljard zoekopdrachten per dag en 1,2 biljoen zoekopdrachten per jaar gegenereerd.

Conclusie;

In het algemeen hebben bedrijven steeds meer data nodig om (maatschappelijke) waarde te creëren en daarmee de diensten te leveren waar wij behoefte aan hebben. 

Gegevens over klimaat zijn erg belangrijk in het kader van weersverwachting op korte en langere termijn en leuk voor de journaalkijker. Deze data is zeker ook belangrijker voor landbouw, weg- en waterbouw, verzekeraars (klimaatverandering), luchtvaartmaatschappijen, enzovoort. Kortom Big Data is voor iedereen belangrijk.

Geheime diensten gebruiken bij Big Data om er specifieke gegevens uit te filteren. De verwerking/ filtering van grote hoeveelheden data is uiteindelijk belangrijker dan het bewaren ervan.

Het ironische is dat slechts 0,5% van alle data op de wereld ooit is geanalyseerd of gebruikt voor het doel waarvoor deze data verzameld is. Dit betreft dus z.g. “Dark Data”. We hebben het verzameld, maar we weten niet wat het is. Ook weten we niet altijd waar het is opgeslagen, wie heeft toegang. In de wereld van analyse en het benutten van Big Data is dus een enorme efficiëntieslag te behalen.

Mijn boodschap aan u is, ga bewust om met gegevens, maar wees er ook niet bang voor.

De kunst van het analyseren is de toekomst en de inzet van kunstmatige intelligentie en “machine learning” zal hierin een grotere rol gaan spelen.

PERCA Security & Investigations kan u en uw bedrijf helpen Big data inzichtelijk te maken en compliant te maken conform wet- en regelgeving betreffende AVG /GDPR.

Ga terug naar het overzicht

Wat kan ik voor u betekenen?

Bent u benieuwd of mijn expertise aansluit op uw vraagstuk? Ik kom graag vrijblijvend met u kennismaken.

Neem contact op

PERCA Security & Investigations