Datawarehouse-markt heeft er een open source-oplossing bij die gebruik maakt van MySQL.
Infobright stelt haar nieuwe datawarehouse-software als open source ter beschikking onder de naam Infobright Community Edition (ICE). Infobright is een enterprise-class, self-managing datawarehouse-oplossing die heeft bewezen een goed alternatief te zijn voor de bekende datawarehouse-producten die veel kosten en onderhoudsintensief zijn. Tevens lanceert Infobright de nieuwe site www.infobright.org als basis voor de community en ontwikkelportal voor open source-enthousiasten. Bovendien heeft www.infobright.org links naar product-downloads en developer/user community’s voor diverse open source databases, en BI- en datawarehouse-projecten.ICE is geïntegreerd met Sun Microsystems’ MySQL database, ‘s werelds populairste open source database.InfoBright is opgericht door 4 Polen, waarvan er 3 gepromoveerd zijn aan de universiteit van Warschau. Het analytische database product dat ze ontwikkeld hebben heet Brighthouse, en is in essentie een storage engine voor MySQL. Dat maakt Brighthouse ook meteen toegankelijk voor een grote groep gebruikers en betekent eveneens dat er ten eerste een wereld aan additionele software beschikbaar is en ten tweede dat het product naadloos in de meeste ICT omgevingen ingepast kan worden. De software wijkt op een paar punten af van de hiervoor beschreven oplossingen. Allereerst is er geen sprake van MPP ondersteuning. Deze is wel voor het eind van 2008 aangekondigd, maar bestaat nu dus nog niet. De tweede afwijking betreft de behaalde compressie die met meer dan 10:1 verder gaat dan alle vergelijkbare oplossingen. De laatste, en wellicht belangrijkste, betreft de wijze van opslag en indexering. De data wordt weliswaar kolomsgewijs opgeslagen maar verder onderverdeeld in 'data packs' van 64K. Elke data pack heeft een corresponderende data pack 'node' waarin de metadata van een data pack wordt opgeslagen. Denk hierbij bijvoorbeeld aan minimum en maximum waarde en data pack totaal in het geval van numerieke waarden. Vervolgens worden er dynamisch zogenaamde 'knowledge nodes' aangemaakt waarin bijvoorbeeld wordt opgeslagen welke combinatie van data packs voor welke joins een resultaat op gaan leveren. Een en ander wordt uitgebreid beschreven in de white papers op de site en zal ik hier omwille van de ruimte achterwege moeten laten. In figuur 5 is schematisch goed te zien hoe de opbouw van de database en overige software componenten in elkaar steekt. Let daarbij vooral op de term 'semantic optimizer'. Er wordt dus vooral getracht om op basis van de beschikbare kennis over de opgeslagen gegevens een snelle responsetijd te realiseren, in tegenstelling tot de overige oplossingen die een meer 'brute force' aanpak hebben. Een wellicht subtiel, maar toch niet onbelangrijk verschil. Bron: Tholis Consulting14 en 15 mei 2025 Organisaties hebben behoefte aan data science, selfservice BI, embedded BI, edge analytics en klantgedreven BI. Vaak is het dan ook tijd voor een nieuwe, toekomstbestendige data-architectuur. Dit tweedaagse seminar geeft antwoord op...
19 t/m 21 mei 2025Praktische driedaagse workshop met internationaal gerenommeerde trainer Lawrence Corr over het modelleren Datawarehouse / BI systemen op basis van dimensioneel modelleren. De workshop wordt ondersteund met vele oefeningen en praktij...
20 en 21 mei 2025 Deze 2-daagse cursus is ontworpen om dataprofessionals te voorzien van de kennis en praktische vaardigheden die nodig zijn om Knowledge Graphs en Large Language Models (LLM's) te integreren in hun workflows voor datamodelleri...
22 mei 2025 Workshop met BPM-specialist Christian Gijsels over AI-Gedreven Business Analyse met ChatGPT. Kunstmatige Intelligentie, ongetwijfeld een van de meest baanbrekende technologieën tot nu toe, opent nieuwe deuren voor analisten met innovatie...
17 t/m 19 november 2025 De DAMA DMBoK2 beschrijft 11 disciplines van Data Management, waarbij Data Governance centraal staat. De Certified Data Management Professional (CDMP) certificatie biedt een traject voor het inleidende niveau (Associate) tot...
Alleen als In-house beschikbaar Het Logical Data Warehouse, een door Gartner geïntroduceerde architectuur, is gebaseerd op een ontkoppeling van rapportage en analyse enerzijds en gegevensbronnen anderzijds. Een flexibelere architectuur waarbij snell...
Deel dit bericht