Datawarehouse-markt heeft er een open source-oplossing bij die gebruik maakt van MySQL.
Infobright stelt haar nieuwe datawarehouse-software als open source ter beschikking onder de naam Infobright Community Edition (ICE). Infobright is een enterprise-class, self-managing datawarehouse-oplossing die heeft bewezen een goed alternatief te zijn voor de bekende datawarehouse-producten die veel kosten en onderhoudsintensief zijn. Tevens lanceert Infobright de nieuwe site www.infobright.org als basis voor de community en ontwikkelportal voor open source-enthousiasten. Bovendien heeft www.infobright.org links naar product-downloads en developer/user community’s voor diverse open source databases, en BI- en datawarehouse-projecten.ICE is geïntegreerd met Sun Microsystems’ MySQL database, ‘s werelds populairste open source database.InfoBright is opgericht door 4 Polen, waarvan er 3 gepromoveerd zijn aan de universiteit van Warschau. Het analytische database product dat ze ontwikkeld hebben heet Brighthouse, en is in essentie een storage engine voor MySQL. Dat maakt Brighthouse ook meteen toegankelijk voor een grote groep gebruikers en betekent eveneens dat er ten eerste een wereld aan additionele software beschikbaar is en ten tweede dat het product naadloos in de meeste ICT omgevingen ingepast kan worden. De software wijkt op een paar punten af van de hiervoor beschreven oplossingen. Allereerst is er geen sprake van MPP ondersteuning. Deze is wel voor het eind van 2008 aangekondigd, maar bestaat nu dus nog niet. De tweede afwijking betreft de behaalde compressie die met meer dan 10:1 verder gaat dan alle vergelijkbare oplossingen. De laatste, en wellicht belangrijkste, betreft de wijze van opslag en indexering. De data wordt weliswaar kolomsgewijs opgeslagen maar verder onderverdeeld in 'data packs' van 64K. Elke data pack heeft een corresponderende data pack 'node' waarin de metadata van een data pack wordt opgeslagen. Denk hierbij bijvoorbeeld aan minimum en maximum waarde en data pack totaal in het geval van numerieke waarden. Vervolgens worden er dynamisch zogenaamde 'knowledge nodes' aangemaakt waarin bijvoorbeeld wordt opgeslagen welke combinatie van data packs voor welke joins een resultaat op gaan leveren. Een en ander wordt uitgebreid beschreven in de white papers op de site en zal ik hier omwille van de ruimte achterwege moeten laten. In figuur 5 is schematisch goed te zien hoe de opbouw van de database en overige software componenten in elkaar steekt. Let daarbij vooral op de term 'semantic optimizer'. Er wordt dus vooral getracht om op basis van de beschikbare kennis over de opgeslagen gegevens een snelle responsetijd te realiseren, in tegenstelling tot de overige oplossingen die een meer 'brute force' aanpak hebben. Een wellicht subtiel, maar toch niet onbelangrijk verschil. Bron: Tholis Consulting7 november (online seminar op 1 middag)Praktische tutorial met Alec Sharp Alec Sharp illustreert de vele manieren waarop conceptmodellen (conceptuele datamodellen) procesverandering en business analyse ondersteunen. En hij behandelt wat elke data-pr...
11 t/m 13 november 2024Praktische driedaagse workshop met internationaal gerenommeerde trainer Lawrence Corr over het modelleren Datawarehouse / BI systemen op basis van dimensioneel modelleren. De workshop wordt ondersteund met vele oefeningen en pr...
18 t/m 20 november 2024Praktische workshop met internationaal gerenommeerde spreker Alec Sharp over het modelleren met Entity-Relationship vanuit business perspectief. De workshop wordt ondersteund met praktijkvoorbeelden en duidelijke, herbruikbare ...
26 en 27 november 2024 Organisaties hebben behoefte aan data science, selfservice BI, embedded BI, edge analytics en klantgedreven BI. Vaak is het dan ook tijd voor een nieuwe, toekomstbestendige data-architectuur. Dit tweedaagse seminar geeft antwoo...
De DAMA DMBoK2 beschrijft 11 disciplines van Data Management, waarbij Data Governance centraal staat. De Certified Data Management Professional (CDMP) certificatie biedt een traject voor het inleidende niveau (Associate) tot en met hogere niveaus van...
3 april 2025 (halve dag)Praktische workshop met Alec Sharp [Halve dag] Deze workshop door Alec Sharp introduceert conceptmodellering vanuit een non-technisch perspectief. Alec geeft tips en richtlijnen voor de analist, en verkent datamodellering op c...
10, 11 en 14 april 2025Praktische driedaagse workshop met internationaal gerenommeerde spreker Alec Sharp over herkennen, beschrijven en ontwerpen van business processen. De workshop wordt ondersteund met praktijkvoorbeelden en duidelijke, herbruikba...
15 april 2025 Praktische workshop Datavisualisatie - Dashboards en Data Storytelling. Hoe gaat u van data naar inzicht? En hoe gaat u om met grote hoeveelheden data, de noodzaak van storytelling en data science? Lex Pierik behandelt de stromingen in ...
Deel dit bericht