Weaviate was de afgelopen maanden talk of the town aan de Amerikaanse west- en oostkust. Investeerders stonden in de rij om de Nederlandse vectordatabase van groeigeld te mogen voorzien. Ondertussen lopen Google en OpenAI weg met de 'simpele softwareboer', om met medeoprichter en CEO Bob van Luijt te spreken. In de aanloop naar zijn keynote presentatie op de Big Data Expo vertelt hij hoe Weaviate op de perfecte golf terecht kwam. "We bouwen de infrastructuur waarop andere bedrijven hun AI-oplossingen kunnen bouwen."
"Natuurlijk is het ook geluk", zegt Van Luijt over de groei van Weaviate, een open-source AI-native vectordatabase. Toeval is het zeer zeker niet: de geboren Brabander zag al in 2016 dat vectordatabases belangrijk zouden worden om het potentieel van kunstmatige intelligentie (AI) te ontsluiten. Van Luijt: "Ik werkte als freelancer voor een uitgeverij toen ik doorkreeg dat een database sterker zou worden als je die geometrisch zou maken met vectors. Later dat jaar zag ik een presentatie van Google-baas Sundar Pichai, waarin hij de beweging van een mobile first naar een AI first world aankondigde. Ik zag direct voor me hoe die beweging kon worden gemaakt: met vector analytics om webpagina’s te doorzoeken."
Omdat het voor hem zo vanzelfsprekend en veelbelovend was, besloot Van Luijt samen met twee compagnons een vectordatabase op te zetten. Bij het bedrijf, dat anno 2023 volop samenwerkt met Google, werken inmiddels bijna vijftig mensen vanaf verschillende plekken in de wereld. "Het mooie is", vertelt Van Luijt trots, "dat Google ons afgelopen mei nog heeft genoemd op zijn jaarlijkse ontwikkelaarsconferentie. Het logo van Weaviate kwam prominent in beeld in het amfitheater."
Vectordatabase
Om de werking van Weaviate uit te leggen trekt Van Luijt de vergelijking met nota bene Google: "Search is eigenlijk een hele grote index: op basis van een zoekterm word je naar de juiste pagina geleid. Een vectordatabase werkt totaal anders: data zijn letterlijk ingedeeld in een ruimte, aan de hand van coördinaten. In zo’n ruimte zal het woord 'bot' zich dichter bij 'hond' bevinden dan bij 'kat'. Ondertussen zijn honden en katten allebei huisdieren, dat kun je als onderdeel van een netwerk ook weer in de ruimte neerleggen. Je kunt wel duizenden dimensies creëren. Door heel veel teksten te lezen, of bijvoorbeeld heel veel plaatjes te bekijken, kan de technologie afstanden en relaties tussen woorden of pixels steeds beter bepalen. Nou kan die database niet alleen coördinaten uitspugen, maar dankzij machine learning ook voorspellen wat de volgende token is van de vier miljard tokens die we geïmporteerd hebben."
Generatieve AI
Daarmee heeft Van Luijt het over generatieve AI. "Men dacht dat dit soort oplossingen nooit op hele grote schaal zou werken, maar het werkte wel toen er zogenoemde temperatuur aan werd toegevoegd." De temperatuur is in deze context een parameter voor de mate van willekeurigheid in de gegenereerde output. "Daarmee worden teksten bijvoorbeeld minder staccato. Randomness verhoogt de creativiteit en maakt de output menselijk en bruikbaar. Het verklaart ook de hallucinaties. Al met al is AI nu heel antropomorfisch: er worden menselijke eigenschappen toegedicht aan de technologie. Dat was bij de vorige revolutie, de opkomst van mobiele technologie, nog helemaal niet het geval."
Developer love
Terug naar Weaviate: hoe is het bedrijf gegroeid? Van Luijt benoemt dat de start-up voor een bottom-up-benadering heeft gekozen. Met zijn collega’s bracht hij de oplossing onder de aandacht bij ontwikkelaars, in de hoop dat zij de software zouden adopteren en op termijn niet zonder meer zouden kunnen: "Zo maakten we langzaam de beweging omhoog in organisaties. Het begint met developer love creëren. Als bottom-up goed loopt, kun je daar op termijn top-down aan toevoegen, dat is de holy grail en daar zijn we nu mee bezig."
ChatGPT
Weaviate heeft de wind mee: nu ChatGPT op zo’n beetje elke verjaardag over de tong gaat, zijn steeds meer bedrijven bezig een strategie voor generatieve AI te ontwikkelen. "Al gaat het hier in Europa bij lange na niet zo snel als in de VS", aldus Van Luijt. "Daar komt ongeveer 80 procent van onze klanten vandaan. Wij bieden de kerninfrastructuur waarop zij hun AI-oplossingen kunnen bouwen, ongedacht de branche waarin ze actief zijn." Op de klantenlijst van Weaviate staan onder andere banken, telecombedrijven en spelers in de gezondheidszorg. Zij worden onder meer op het bedrijf geattendeerd door OpenAI, het bedrijf achter ChatGPT. "Zij zijn ons actief gaan aanbevelen, nadat ze eerst zelf een soortgelijke oplossing boden. Op een dag waren we één van de drie gesuggereerde zoektools voor vectordata, dat kon je de volgende dag wel merken."
Groeigeld
Weaviate haalde dit voorjaar 50 miljoen dollar groeigeld op in een investeringsronde die werd geleid door het prestigieuze Index Ventures. Daarmee werd het Amsterdamse bedrijf op het viervoudige gewaardeerd, maar om die waardering was het de oprichters niet te doen volgens Van Luijt. Hij had naar eigen zeggen meer dan honderd potentiële geldverstrekkers in zijn mailbox, maar hij koos gericht een paar nieuwe (naast de bestaande) uit om het team uit te kunnen breiden en de software door te kunnen ontwikkelen. Weaviate heeft twee verdienmodellen, legt de ondernemer uit: er is een SaaS-oplossing voor kleinere en middelgrote bedrijven ("Dan regelen wij het voor je"). Daarnaast is er de Bring Your Own Cloud oplossing, waarmee grotere bedrijven de vectordatabase bijvoorbeeld in hun Amazon Web Services-omgeving kunnen laten draaien.
Next
Van Luijt had goed voorzien dat vectordatabases een rol van betekenis zouden spelen in de toekomst van het internet. Wat hij niet voorzag is de enorme vlucht die generatieve AI de laatste tijd heeft genomen: "We zitten in de lift, het gaat hard, harder dan ik zelf had verwacht. Laatst was ik in New York en toen zag ik mezelf en mijn compagnon Etienne Dilocker hangen op de hoek van de Nasdaq. Dit soort gekke dingen gebeurt de hele tijd. Je merkt ook dat het steeds gezelliger wordt wat de concurrentie betreft. In San Francisco zag ik onlangs allerlei vectordatabases gepromoot worden waar ik het bestaan nog niet van kende. Andere bedrijven zijn het erbij gaan doen. Dat is wel raar moet ik zeggen. Maar een goede database heb je niet van vandaag of morgen."
Hoe de markt er over drie jaar uitziet durft Van Luijt ten slotte niet te voorspellen. "Dat weet ik echt niet. Op dit moment gaat het goed. I’m enjoying the ride basically."
Bob van Luijt, oprichter en CEO van Weaviate, spreekt op woensdag 13 september om 14.30 uur op het keynote-podium van de Big Data Expo. Tickets voor het #1 data event zijn gratis beschikbaar.
7 november (online seminar op 1 middag)Praktische tutorial met Alec Sharp Alec Sharp illustreert de vele manieren waarop conceptmodellen (conceptuele datamodellen) procesverandering en business analyse ondersteunen. En hij behandelt wat elke data-pr...
11 t/m 13 november 2024Praktische driedaagse workshop met internationaal gerenommeerde trainer Lawrence Corr over het modelleren Datawarehouse / BI systemen op basis van dimensioneel modelleren. De workshop wordt ondersteund met vele oefeningen en pr...
18 t/m 20 november 2024Praktische workshop met internationaal gerenommeerde spreker Alec Sharp over het modelleren met Entity-Relationship vanuit business perspectief. De workshop wordt ondersteund met praktijkvoorbeelden en duidelijke, herbruikbare ...
26 en 27 november 2024 Organisaties hebben behoefte aan data science, selfservice BI, embedded BI, edge analytics en klantgedreven BI. Vaak is het dan ook tijd voor een nieuwe, toekomstbestendige data-architectuur. Dit tweedaagse seminar geeft antwoo...
De DAMA DMBoK2 beschrijft 11 disciplines van Data Management, waarbij Data Governance centraal staat. De Certified Data Management Professional (CDMP) certificatie biedt een traject voor het inleidende niveau (Associate) tot en met hogere niveaus van...
3 april 2025 (halve dag)Praktische workshop met Alec Sharp [Halve dag] Deze workshop door Alec Sharp introduceert conceptmodellering vanuit een non-technisch perspectief. Alec geeft tips en richtlijnen voor de analist, en verkent datamodellering op c...
10, 11 en 14 april 2025Praktische driedaagse workshop met internationaal gerenommeerde spreker Alec Sharp over herkennen, beschrijven en ontwerpen van business processen. De workshop wordt ondersteund met praktijkvoorbeelden en duidelijke, herbruikba...
15 april 2025 Praktische workshop Datavisualisatie - Dashboards en Data Storytelling. Hoe gaat u van data naar inzicht? En hoe gaat u om met grote hoeveelheden data, de noodzaak van storytelling en data science? Lex Pierik behandelt de stromingen in ...
Deel dit bericht