Recent nam Mike Olson, medeoprichter van Cloudera, de tijd voor een interview met Walter van der Scheer van GoDataDriven over de ontwikkelingen op het gebied van open source. Cloudera is opgericht in 2008 als eerste commerciële Hadoop-distributie. Hadoop was toen nog geen twee jaar op de markt. In deze relatief korte tijd heeft er een ware Big Data revolutie plaatsgevonden, voor Mike leidt het geen twijfel dat de innovatiesnelheid en adoptie van open source de komende jaren alleen maar zal toenemen.
"Tien jaar geleden hadden CIO’s nog weinig vertrouwen in open source software. Over het algemeen zien we de angst om open source software te gebruiken afnemen. Ik gebruik het woord ‘angst’ hier bewust”, gaat Mike Olson van start, “Executives vonden destijds de open source producten niet geschikt om te gebruiken vanwege de ontwikkelwijze. Tegenwoordig is dit argument zeker niet meer van toepassing. Open source software voldoet inmiddels aan alle regels en richtlijnen en stelt CIO’s in staat om te profiteren van de innovatiesnelheid”.
Er zijn vier redenen waarom open source software steeds vaker ingezet wordt bij (grote) organisaties.
1. Beveiligingseisen en wet-en regelgeving
Voldoet open source software wel aan alle regels en richtlijnen, is het veilig genoeg om in te zetten? Mike Olson: “Er zijn vele voorbeelden van zeer grote, zeer veilige, implementaties van open source platformen in missiekritische applicaties, waarbij het platform volledig voldoet aan de zeer strenge regels en eisen. Cloudera is het enige Hadoop platform dat gecertificeerd is volgens de PCI Data Security Standaard, wat betekent dat het mogelijk is om persoonsgegevens wereldwijd op te slaan.”
Mike benadrukt dat er geen reden is voor CIO’s om bezorgd te zijn over beveiliging en privacywetgeving. Uiteindelijk gaat het helemaal niet om het feit dat software open source is, of om de manier van ontwikkelen. Het gaat vooral om de eisen die grote organisaties stellen aan datamanagementplatformen; open source voldoet steeds vaker aan deze eisen.
2. Profiteren van nieuwe innovatie
Als er één ding is waar CIO’s een hekel aan hebben dan is het wel vastzitten aan een softwareleverancier, lock-in genoemd. Een CIO heeft behoefte aan flexibiliteit, zodat oplossingen gebruik kunnen maken van de laatste technologische innovaties. Dit betekent dat je wil profiteren van de ontwikkelsnelheid binnen de wereldwijde gemeenschap van open source ontwikkelaars die samenwerken aan nieuwe functionaliteit en verbetering. Open source oplossingen zijn licentievrij, CIO’s kunnen software direct vervangen zodra er betere producten op de markt komen.
3. Platform Software kan niet anders dan open source
Al sinds het begin van de jaren tachtig is Mike Olson actief op het gebied van datamanagement. Hij heeft de marktontwikkelingen van dichtbij meegemaakt en heeft de wijze waarop software wordt ontwikkeld zien veranderen. “In de afgelopen tien jaar is er geen enkel gesloten platform (database of operating system) succesvol gelanceerd door een ontwikkelbedrijf. Gesloten platformen worden vervangen door open source. Dit is een trend in elke categorie; databases, besturingssystemen, middleware. Denk er maar eens over: JBoss voor middleware, Linux voor besturingssystemen, MySQL, Postgres en Hadoop voor databeheer”, zegt Mike. "Ik ben er dan ook van overtuigd dat het tegenwoordig een natuurwet is dat de enige manier om succesvol een platform te lanceren is door het als open source aan te bieden."
Is er dan helemaal geen ruimte meer voor gesloten software? Nee, dat ook weer niet, open source biedt volgens Mike Olsen grote kansen, maar er blijft zeker ruimte voor gesloten platformen als aanjager van innovatie. Open source communities zijn namelijk heel goed in het ontwikkelen van een platform, maar over het algemeen minder succesvol in de ontwikkeling van bedrijfsapplicaties. Als je denkt aan geweldige analytische producten of ERP-systemen dan zijn dit over het algemeen gesloten producten bovenop een open source platform.
4. Open Source geeft ruimte aan nieuwe toepassingen
Zal Hadoop alle andere databaseplatformen vervangen? Mike Olson denkt niet dat het zo’n vaart zal lopen. “In sommige gevallen kan Hadoop bestaande processen van andere systemen overnemen, dat is zeker mogelijk. Maar vergeet niet dat de 8.000 grootste bedrijven ter wereld (de doelgroep van Cloudera, red.) al jaren datagedreven werken. Dit zijn bedrijven die data heel goed weten in te zetten. Er zijn genoeg goede datawarehouse, OLTP-, en andere systemen waarop deze organisaties vertrouwen. Grote organisaties gebruiken al jaren dashboards en rapporten in hun bedrijfsvoering. De mogelijkheid ontstaat nu om niet alleen maar met terugwerkende kracht te kijken naar historische en actuele gegevens, maar om voorspellend te gaan werken".
Op dit vlak biedt Hadoop kansen om fantastische nieuwe toepassingen te ontwikkelen. En om te voorspellen wat er gaat gebeuren en hoe je hier als organisatie optimaal op kan inspelen. Hadoop is ontwikkeld om deze geavanceerde analytische dataprocessing op grote datasets uit te voeren. "Het is belangrijk om te integreren met bestaande systemen, zodat je niet alle bestaande infrastructuur hoeft te vervangen.”
Wat is de toekomst van Hadoop?
Hadoop is nu acht jaar op de markt en de ontwikkelingen binnen het platform zijn gigantisch geweest. Wat gaat er de komende periode gebeuren? Mike Olson voorziet dat de technologie en de applicaties binnen het ecosysteem zich steeds verder ontwikkelen en is enthousiast over de innovatie in de opslaglaag. "Toen ik Cloudera oprichtte was Hadoop niet meer dan HDFS als opslaglaag, en MapReduce, als verwerkingslaag. Hierdoor was er maar één manier om met data te werken. Sinds die tijd is Hadoop doorontwikkeld tot een collectie van processing en analytics toepassingen binnen één omgeving. Voorbeelden van nieuwe ontwikkelingen zijn HBase, die steeds meer SQL-processen overneemt, Cloudera Impala (tegenwoordig Apache Impala), als open source oplossing om op grote schaal data te analyseren en Cloudera Search, welke ontwikkeld is op Lucene en Solar technologie. Apache Spark is een lichtend voorbeeld van innovatie binnen de Hadoop community, wat wordt de volgende Spark binnen het Hadoop ecosysteem?"
Ecosysteem
Verder komen er steeds meer applicaties beschikbaar bovenop Hadoop. Voor Cloudera is deze ontwikkeling belangrijk, omdat deze diensten, applicaties en hardware het gemakkelijker maken voor organisaties om aan de slag te gaan met het platform. "We zien partners die oplossingen ontwikkelen van mobiele telefoniesystemen tot cybersecurity maar ook nieuwe analytics en rapportage oplossingen. Cloudera en Hadoop zelf bieden deze oplossingen niet. Het is de rol van Cloudera om organisaties te voorzien van een stabiel en schaalbaar platform om deze applicaties op te draaien. Partners leiden ook onze klanten op, helpen ze bij het aanwijzen van use cases en deze in productie te brengen”, aldus Mike Olson.
7 november (online seminar op 1 middag)Praktische tutorial met Alec Sharp Alec Sharp illustreert de vele manieren waarop conceptmodellen (conceptuele datamodellen) procesverandering en business analyse ondersteunen. En hij behandelt wat elke data-pr...
11 t/m 13 november 2024Praktische driedaagse workshop met internationaal gerenommeerde trainer Lawrence Corr over het modelleren Datawarehouse / BI systemen op basis van dimensioneel modelleren. De workshop wordt ondersteund met vele oefeningen en pr...
18 t/m 20 november 2024Praktische workshop met internationaal gerenommeerde spreker Alec Sharp over het modelleren met Entity-Relationship vanuit business perspectief. De workshop wordt ondersteund met praktijkvoorbeelden en duidelijke, herbruikbare ...
26 en 27 november 2024 Organisaties hebben behoefte aan data science, selfservice BI, embedded BI, edge analytics en klantgedreven BI. Vaak is het dan ook tijd voor een nieuwe, toekomstbestendige data-architectuur. Dit tweedaagse seminar geeft antwoo...
De DAMA DMBoK2 beschrijft 11 disciplines van Data Management, waarbij Data Governance centraal staat. De Certified Data Management Professional (CDMP) certificatie biedt een traject voor het inleidende niveau (Associate) tot en met hogere niveaus van...
3 april 2025 (halve dag)Praktische workshop met Alec Sharp [Halve dag] Deze workshop door Alec Sharp introduceert conceptmodellering vanuit een non-technisch perspectief. Alec geeft tips en richtlijnen voor de analist, en verkent datamodellering op c...
10, 11 en 14 april 2025Praktische driedaagse workshop met internationaal gerenommeerde spreker Alec Sharp over herkennen, beschrijven en ontwerpen van business processen. De workshop wordt ondersteund met praktijkvoorbeelden en duidelijke, herbruikba...
15 april 2025 Praktische workshop Datavisualisatie - Dashboards en Data Storytelling. Hoe gaat u van data naar inzicht? En hoe gaat u om met grote hoeveelheden data, de noodzaak van storytelling en data science? Lex Pierik behandelt de stromingen in ...
Deel dit bericht