10-05-2024 Door: Rein de Jong

Hoe zijn GenAI-projecten uit het laboratorium naar de praktijk te brengen?

Deel dit bericht

Generatieve AI (GenAI) was het afgelopen jaar de belangrijkste technologietrend. Opgejaagd door het succes van ChatGPT hebben bedrijven als Amazon, Microsoft en Google de eigen ontwikkelingen aanzienlijk versneld. Dat heeft een vloedgolf aan innovaties opgeleverd die de wijze waarop mensen en bedrijven met technologie omgaan om de productiviteit te verhogen, op een revolutionaire wijze beloven te veranderen.

Natuurlijk is er al vooruitgang geboekt in verschillende markten, zoals de farmaceutische industrie en advocatuur. Wat we tot nu toe hebben gezien, is echter nog maar het prille begin van deze nieuwe technologie. De ware kracht van GenAI wordt pas duidelijk zodra organisaties hun experimentele resultaten op grotere schaal in de processen gaan toepassen.

Om op de AI-vloedgolf mee te kunnen surfen, in plaats van achter te blijven, moeten organisaties nog een aantal belangrijke uitdagingen op het gebied van kosten en vertrouwen tackelen. Daarvoor is een duidelijke data-roadmap nodig die alle voordelen van de cloud benut.

Kosten en vertrouwen zijn grootste barrières
Wat GenAI betreft, geldt nog steeds het oude automatiseringsprincipe van 'garbage in, garbage out'. Je kunt niet verwachten dat AI-toepassingen bruikbare resultaten opleveren als het model wordt getraind op onbetrouwbare data. De uitdaging daarbij is dat databeheer en -beveiliging zich in veel organisaties nog in de kinderschoenen bevinden. Verder wordt veel cruciale informatie nog in silo's opgeslagen, waardoor deze feitelijk onbruikbaar is zonder een kostbare integratie. Dit betekent dat AI-trainingsdata van slechte kwaliteit kan zijn en een cruciale zakelijke context mist. Met als logische gevolgen hallucinaties (fictieve informatie die realistisch lijkt), of reacties die de benodigde context missen. In beide gevallen voegen ze geen waarde toe en veroorzaken ze misschien wel imagoschade.

Een tweede uitdaging van GenAI-projecten zijn de hoge kosten. Hoewel outsourcing risico’s op het gebied van security en compliance met zich meebrengt, kan alles zelf doen bijzonder kostbaar zijn. Eén geavanceerde GPU, speciaal ontworpen voor het uitvoeren van grote taalmodellen (LLM's), kost circa € 25.000. Als een bedrijf een model wil trainen met bijvoorbeeld 175 miljard parameters, zijn er misschien wel 2.000 GPU's nodig. Dat resulteert dan in een rekening van tientallen miljoenen euros.

GenAI in bedrijfsprocessen toepassen
De potentieel hoge training- en implementatiekosten zijn een belangrijke reden waarom het gebruik van een cloudinfrastructuur als basis voor AI steeds populairder wordt. Cloudproviders beschikken al over de GPU’s waarmee organisaties GenAI-projecten kunnen opschalen en daarbij alleen betalen voor wat ze gebruiken. Hierdoor kunnen ze volop experimenteren met GenAI en het model opslaan zodra ze klaar zijn met sleutelen, in plaats van GPU te moeten inrichten in on-premise omgevingen. Dat kan een forse kostenbesparing opleveren en biedt vergaande flexibiliteit om de AI-toepassingen indien succesvol in de toekomst alsnog intern te gaan uitvoeren.
Hoe kunnen bedrijven, als ze voor de cloud hebben gekozen, GenAI-projecten uit het laboratorium in de processen gaan implementeren? Het BRIESO-model – Build, Refine, Identify, Experiment, Scale & Optimize is daarvoor te benutten:

Build: Creëer eerst een moderne data-architectuur en zakelijke data-mesh. Of het nu op locatie of in de cloud is, hiermee kan de organisatie inzicht in en controle krijgen over alle data. Het helpt tevens bij het opzetten van een uniforme ontologie voor het in kaart brengen, beveiligen en bereiken van compliance binnen alle datasilo’s. Zoek naar tools die zowel aan de huidige vraag helpen te voldoen, als de schaalbaarheid bieden om toekomstige groei mogelijk te maken. Open source-oplossingen bieden vaak de grootste flexibiliteit.

Refine: Daarna is het tijd om data te verfijnen en te optimaliseren op basis van de zakelijke vereisten. In dit stadium is het belangrijk om alvast te anticiperen op toekomstige ontwikkelingen. Dit verkleint namelijk de kans dat er onnodige data worden gemigreerd, die geen waarde toevoegt, maar wel de kosten van het project aanzienlijk verhogen.

Identify: Mogelijkheden ontdekken om de cloud te benutten voor specifieke workloads. Een analyse van de workloads kan hier nuttig zijn om te bepalen waaruit de meeste waarde kan worden gehaald. Het gaat om het verbinden van data op verschillende locaties, zowel intern als in meerdere clouds, om het project te optimaliseren. Dit is ook een goed moment om mogelijke gebruiksscenario's voor de verdere ontwikkeling te overwegen.

Experiment: Experimenteer met vooraf gebouwde GenAI-frameworks van derden om de aanpak te vinden die het beste aansluit bij de eigen behoeften en eisen. Er is al genoeg beschikbaar om uit te kiezen, zoals AWS's Bedrock (Hugging Face), Azure's OpenAI (ChatGPT) en Google's AI Platform (Vertex). Neem ook niet te snel beslissingen, want het model moet naadloos integreren met de eigen bedrijfsdata, om een project succesvol te kunnen uitvoeren.

Scale & Optimize: Zodra een geschikt platform is gekozen, is het verstandig een of twee toepassingen te kiezen om op te schalen naar de productieve fase. Optimaliseer het proces continu, maar houd de GPU-gerelateerde kosten in de gaten voor het geval deze te snel oplopen. Zodra het GenAI-gebruik van de organisatie begint te groeien, moet u ook al gaan zoeken naar manieren om de toepassing(en) te optimaliseren. Een flexibel AI-platform is namelijk cruciaal voor de lange termijn successen.

Stap nu in de toekomst
Business- en IT-managers zijn begrijpelijkerwijs enthousiast over het transformatieve potentieel van GenAI-applicaties. Variërend van verbeterde klantenservice tot naadloos supply chain management en krachtige DevOps. Maar liefst 98% van de wereldwijd ondervraagde managers is van mening dat AI-basismodellen de komende drie tot vijf jaar een belangrijke rol gaan spelen in hun strategie.

Voordat iemand zich al snel laat meeslepen, is er nog veel werk aan de winkel. Een moderne data- architectuur behoort het startpunt te zijn voor elk succesvol AI-project. Pas daarna is er tijd om te bouwen, verfijnen, identificeren, experimenteren, schalen en optimaliseren. Stap nu in de toekomst!

Company:

Cloudera

Rein de Jong

Rein de Jong is Regional Vice President Benelux bij Cloudera.

Alle blogs van deze auteur

Partners