Datawarehouse-markt heeft er een open source-oplossing bij die gebruik maakt van MySQL.
Infobright stelt haar nieuwe datawarehouse-software als open source ter beschikking onder de naam Infobright Community Edition (ICE). Infobright is een enterprise-class, self-managing datawarehouse-oplossing die heeft bewezen een goed alternatief te zijn voor de bekende datawarehouse-producten die veel kosten en onderhoudsintensief zijn. Tevens lanceert Infobright de nieuwe site www.infobright.org als basis voor de community en ontwikkelportal voor open source-enthousiasten. Bovendien heeft www.infobright.org links naar product-downloads en developer/user community’s voor diverse open source databases, en BI- en datawarehouse-projecten.ICE is geïntegreerd met Sun Microsystems’ MySQL database, ‘s werelds populairste open source database.InfoBright is opgericht door 4 Polen, waarvan er 3 gepromoveerd zijn aan de universiteit van Warschau. Het analytische database product dat ze ontwikkeld hebben heet Brighthouse, en is in essentie een storage engine voor MySQL. Dat maakt Brighthouse ook meteen toegankelijk voor een grote groep gebruikers en betekent eveneens dat er ten eerste een wereld aan additionele software beschikbaar is en ten tweede dat het product naadloos in de meeste ICT omgevingen ingepast kan worden. De software wijkt op een paar punten af van de hiervoor beschreven oplossingen. Allereerst is er geen sprake van MPP ondersteuning. Deze is wel voor het eind van 2008 aangekondigd, maar bestaat nu dus nog niet. De tweede afwijking betreft de behaalde compressie die met meer dan 10:1 verder gaat dan alle vergelijkbare oplossingen. De laatste, en wellicht belangrijkste, betreft de wijze van opslag en indexering. De data wordt weliswaar kolomsgewijs opgeslagen maar verder onderverdeeld in 'data packs' van 64K. Elke data pack heeft een corresponderende data pack 'node' waarin de metadata van een data pack wordt opgeslagen. Denk hierbij bijvoorbeeld aan minimum en maximum waarde en data pack totaal in het geval van numerieke waarden. Vervolgens worden er dynamisch zogenaamde 'knowledge nodes' aangemaakt waarin bijvoorbeeld wordt opgeslagen welke combinatie van data packs voor welke joins een resultaat op gaan leveren. Een en ander wordt uitgebreid beschreven in de white papers op de site en zal ik hier omwille van de ruimte achterwege moeten laten. In figuur 5 is schematisch goed te zien hoe de opbouw van de database en overige software componenten in elkaar steekt. Let daarbij vooral op de term 'semantic optimizer'. Er wordt dus vooral getracht om op basis van de beschikbare kennis over de opgeslagen gegevens een snelle responsetijd te realiseren, in tegenstelling tot de overige oplossingen die een meer 'brute force' aanpak hebben. Een wellicht subtiel, maar toch niet onbelangrijk verschil. Bron: Tholis Consulting27 t/m 29 oktober 2025Praktische driedaagse workshop met internationaal gerenommeerde trainer Lawrence Corr over het modelleren Datawarehouse / BI systemen op basis van dimensioneel modelleren. De workshop wordt ondersteund met vele oefeningen en pra...
29 en 30 oktober 2025 Deze 2-daagse cursus is ontworpen om dataprofessionals te voorzien van de kennis en praktische vaardigheden die nodig zijn om Knowledge Graphs en Large Language Models (LLM's) te integreren in hun workflows voor datamodel...
3 t/m 5 november 2025Praktische workshop met internationaal gerenommeerde spreker Alec Sharp over het modelleren met Entity-Relationship vanuit business perspectief. De workshop wordt ondersteund met praktijkvoorbeelden en duidelijke, herbruikbare ri...
11 en 12 november 2025 Organisaties hebben behoefte aan data science, selfservice BI, embedded BI, edge analytics en klantgedreven BI. Vaak is het dan ook tijd voor een nieuwe, toekomstbestendige data-architectuur. Dit tweedaagse seminar geeft antwoo...
17 t/m 19 november 2025 De DAMA DMBoK2 beschrijft 11 disciplines van Data Management, waarbij Data Governance centraal staat. De Certified Data Management Professional (CDMP) certificatie biedt een traject voor het inleidende niveau (Associate) tot...
25 en 26 november 2025 Worstelt u met de implementatie van data governance of de afstemming tussen teams? Deze baanbrekende workshop introduceert de Data Governance Sprint - een efficiënte, gestructureerde aanpak om uw initiatieven op het...
26 november 2025 Workshop met BPM-specialist Christian Gijsels over AI-Gedreven Business Analyse met ChatGPT. Kunstmatige Intelligentie, ongetwijfeld een van de meest baanbrekende technologieën tot nu toe, opent nieuwe deuren voor analisten met ...
9 december (online seminar op 1 middag)Praktische tutorial met Alec Sharp Alec Sharp illustreert de vele manieren waarop conceptmodellen (conceptuele datamodellen) procesverandering en business analyse ondersteunen. En hij behandelt wat elke data-pr...
Deel dit bericht