Introductie

De laatste jaren komt het onderwerp big data vaak aan bod in de media. Meestal gaat het dan over de vraag: ‘Hoe kunnen we op een goede manier met big data omgaan? En wat mag wel en wat mag niet?’ Aan de ene kant kunnen we dankzij big data betere producten en diensten leveren. Aan de andere kant vragen velen zich af hoe het zit met de bescherming van de privacy van individuele burgers.

“We zijn ervan overtuigd dat big data het leven ingrijpend zal veranderen.”

Eric van Tol en Gerard Schouten

Director Expertisecentrum Big Data en
Lector Big Data

  • Kenmerken vakgebied

    De belangrijkste kenmerken van Big Data als vakgebied zijn:

    1. Een doorlopend groeiende verzameling van gegevens van uiteenlopende en snel wisselende samenstelling, te groot en te ongestructureerd om met conventionele data management technologie efficiënt en effectief te beheren en te ontsluiten.
    2. Een keten van stappen: inname & opslag, extractie & opschonen, integratie & aggregatie, analyse & modellering, interpretatie & collaboratie. De te doorlopen stappen zijn vaak iteratief en hebben een ‘agile’ karakter.
    3. Een verzameling innovatieve technologieën (opslag, processing hardware, analyse software) en technieken (mathematische analyse en visualisatie) voor de verschillende stappen.
  • Big Data kernprofielen

    In het nieuwe ‘Big Data’ speelveld is een nieuw soort ICT-er nodig. Er is een nieuwe functie ontstaan, namelijk de Big Data Scientist, met naast programeervaardigheden een sterke achtergrond op het gebied van wiskunde en statistiek. Er is enorme vraag voor onstaan voor dit profiel. Nieuwe studenten van hogescholen en universiteiten zullen niet aan deze vraag kunnen voldoen.

    De ideale achtergrond van de kandidaten is kennis van statistiek, wiskunde (matrix- en vectorrekening) en programmeren (ICT). Deze basis is te vinden bij bijvoorbeeld statistici, ingenieurs, ICT’ers, wis en natuurkundigen of econometristen. Daarnaast zijn zij sterk in het visueel en verbaal communiceren.
    Deze Big Data Scientist is in twee archetyperollen te verdelen, de Data Detective en de Hadoop Hacker.
    Aan de organisatorische kant, met domein kennis, de Data Detective: een manager/analist die de juiste vragen kan stellen. Aan de technische kant de Hadoop Hacker: de ICT deskundige die Big Data technologieën kan implementeren en onderhouden.
    De term Big Data practitioner is beter. De Big Data scientist heeft wel een onderzoekshouding maar bedrijft geen wetenschap. De Big Data scientist is eerder een Big Data practitioner die diverse algoritmes/oplossingen toepast en de best werkende behoudt. Een soort ‘trial and error’ aanpak dus. Hiervoor dient de data practitioner een breed scala aan tools en data analyse en visualisatiemethodes te kennen. Deze aanpak werkt voor commerciële bedrijven uitermate goed.

  • Best practices

    Inmiddels zien veel MKB bedrijven de mogelijkheden en voordelen van Big Data. Het is echter niet trivaal om dit nieuwe data-driven pad in te slaan.
    Welke vragen zijn of worden belangrijk? Welke nieuwe tools zijn hiervoor nodig? Hoe moeten de organisatie hierop ‘getuned’ worden?
    Met deze vragen kan Fontys Hogeschool ICT het MKB helpen, met onder andere:
    - het uitvoeren van een ‘quick scan’ met betrekking tot deze onderwerpen;
    - een ‘data-sanity’ in kaart brengen (ten aanzien van het verzamelen en opschonen van data, data analyse, en data visulisatie).
    Daarnaast is een in-company brede Big Data cursus (of aantal workshops) mogelijk.

    Wij zijn ervan overtuigd dat big data de komende decennia verandering zal brengen in de manier waarop overheden en ondernemingen functioneren. Big data kan een grote bijdrage leveren aan het verbeteren van de effectiviteit van ondernemingen, de gezondheidszorg en het openbaar bestuur. Individuele burgers zullen daarvan ruimschoots kunnen profiteren. De Big Data Engineers die wij opleiden zullen daarbij een doorslaggevende rol spelen.