17-03-2013

PowerPivot als aanvulling op het datawarehouse

Deel dit bericht


Veel mensen zien Excel als eindpunt van de BI-omgeving. Er circuleren veel Excel-workbooks in bedrijven, meestal gemaakt door handige gebruikers die hun producten doormailen naar collega's. Deze gaan er op hun beurt mee aan de slag. Zo kan het gebeuren dat er steeds meer verschillende versies met verschillende data in omloop zijn, waarbij niemand weet wat de status van het document is. Een ware Excel-hel dus.

Er zijn mensen die hun brood verdienen met het oplossen van deze problemen, maar de business is gebaat bij één BI-platform, waar alle benodigde relevante informatie kan worden gevonden en die `onaantastbaar' is.

Het probleem van de Excel-hel kun je op twee manieren oplossen, schetst Michiel Rozema, Product Solutions Marketing Manager bij Microsoft. "Je verbiedt Excel, maar dat blijkt in de praktijk niet echt te werken. Je begrijpt dat Microsoft dat geen reële optie vindt. Excel is een goede omgeving om de zaken te analyseren. We moeten dus een manier vinden om de nadelen van Excel op te lossen. Dan heb je het over: hoe deel je de informatie met elkaar. Hoe zorg je ervoor dat als 100 mensen gebruik maken van het workbook, de informatie correct blijft. Dus hoe voorkom je dat mensen formules of data aanpassen".

Voor professioneel gebruik heeft Excel bovendien een aantal beperkingen. Een daarvan betreft de hoeveelheid data die je in het programma kwijt kunt (een miljoen records). Een ander is dat mensen soms hele complexe berekeningen maken en daar enorm veel tijd in steken. En iedere nieuwe maand plegen ze deze exercitie opnieuw om alles te actualiseren. Volgens Michiel Rozema wordt dit vooral veroorzaakt doordat het programma zo krachtig is. "Je kunt Excel voor steeds meer functies gebruiken en dat heeft geleid tot dit soort situaties. Wat PowerPivot doet is in feite de beperkingen van Excel opheffen. Je kunt veel meer records kwijt dan in het Excel worksheet. We hebben voorbeelden, waarbij mensen 100 miljoen records hebben opgeslagen. Je moet je afvragen of je dat moet willen, maar goed, het kan. PowerPivot is ook een omgeving waarin je veel informatie uit allerlei verschillende bronnen kunt samenbrengen. Corporate BI wordt meestal (en bij voorkeur) niet met Excel gedaan, maar met dashboards, reports, datawarehouses, enzovoort. PowerPivot is echter heel handig als je informatie van buiten het corporate datawarehouse wilt opnemen in je analyses".

In PowerPivot zit een nieuwe functietaal, DAX (Dynamic Analysis Expressions), waarmee je krachtige berekeningen kunt uitvoeren. Met name zogenaamde Time Intelligence functies zijn hierin belangrijk. Als je bijvoorbeeld een lijstje met verkoopgegevens hebt en je wilt weten wat je dit jaar tot nog toe hebt gedaan, kun je dat dankzij DAX met één handeling oproepen. In Excel moet je daarvoor nog verschillende handelingen uitvoeren. Met dit alles is het nog steeds mogelijk om Excel workbooks naar iemand anders te mailen, die daar weer in kan wijzigen. Dit los je met PowerPivot voor Excel niet op.

Delen in SharePoint

PowerPivot voor SharePoint is ontworpen vanuit de gedachte 'niet mailen maar delen'. Met deze versie kun je analyses delen via internet of intranet. Mensen die toegang hebben tot deze plek op SharePoint zien de analyse eigenlijk als webapplicatie. Het is een read-only versie van het workbook. Ze kunnen de gegevens inzien, maar niet aanpassen. PowerPivot weet welke databronnen zijn gebruikt. De verantwoordelijke analist of IT'er kan aangeven dat gegevens uit deze bronnen regelmatig worden ververst. Het workbook kan worden gedownload en aangepast, maar dan kan het niet meer op SharePoint worden gepubliceerd.

`Onder water' is PowerPivot eigenlijk Analysis Services technologie uit SQL Server: een analyseomgeving die je op een server kunt draaien. Op het moment datje een PowerPivot workbook publiceert op SharePoint wordt het een Analysis Services instantie binnen SharePoint en kun je het op dezelfde manier benaderen. Je kunt dus lokaal Excel openen, een connectie maken met het workbook op SharePoint en daar bepaalde werkbladen uithalen en er de dingen mee doen die je wilt doen. Daarmee blijft het officiële document intact.

In PowerPivot zit ook een monitorfunctie. Als bepaalde workbooks populair worden en veel worden geraadpleegd levert dat meer gebruikers en meer dataverkeer op. Je wilt dan graag kunnen beoordelen of het systeem goed blijft performen. Misschien moet dat op een gegeven moment wel worden doorontwikkeld naar een corporate oplossing die in een officiële datawarehouse- en analyseomgeving draait.

Dat kan ook met PowerPivot. Er zit een dashboard in voor de IT-kant en daar hebben ze zicht op welke servers PowerPivot draait, welke oplossingen daar draaien, hoeveel gebruikers die hebben, welke databronnen worden gebruikt, wanneer ze voor het laatst zijn ververst, hoeveel gebruik er van wordt gemaakt. Je kunt dan zien dat het gebruik van een databron plotseling explodeert en ervoor kiezen die op een aparte server of in een corporate omgeving te laten draaien.

Verlengstuk

Dennis Rosenbrand, principal consultant bij Macaw Business Solutions: "Je kunt precies nagaan welke sheets met welke informatie het meest worden gebruikt. Deze informatie kan gebruikt worden bij het plannen van het BI-programma. Een bijkomend voordeel van PowerPivot is dat zodra je een kleine business case hebt afgerond, je die BI-gegevens kunt weggooien. Dat was vroeger volstrekt ondenkbaar. Daar zat zo veel geld in, dat gooi je niet weg".

PowerPivot is niet een vervanging voor de klassieke BI-omgeving, maar een verlengstuk daarvan. Een laatste stap naar de eindgebruiker toe. Bovendien breng je Excel dichter bij de IT, zonder dat de gebruiker het idee heeft onder de plak van de IT te zitten.

"Vanuit de architectuur gezien wordt een eigen laag over de bronapplicaties gezet, waar je met PowerPivot op inprikt. Op die manier zorg je voor een aantal voordelen. Stel dat je ook je gestructureerde omgeving hebt voor BI, dan wil je wel als 100 uit PowerPivot komt, er ook 100 uit je gestructureerde omgeving komt. De gestructureerde omgeving geeft de waarheid weer die zowel voor de interne als externe verantwoording wordt gebruikt. Ik heb vraagtekens bij `PowerPivot voor iedereen'. In eerste instantie is het iets voor de businessanalisten binnen de organisatie. Want de inhoudelijke kennis over de brondata is de basis voor een goede analyse. De bouwers van de grote Excel-sheets waren ook al de businessanalisten, dus er verandert weinig. De nadruk op de werkzaamheden verandert wel omdat het verzamelen van betrouwbare data vrijwel geen tijd meer kost", zegt Rosenbrand.

Rozema: "De grootste wens van de eindgebruiker is niet om alle informatie te krijgen, maar om de juiste informatie op een handzame manier te krijgen. Daar geven we in PowerPivot ook aandacht aan. Neem een analyseomgeving met alle sales data. Daarin zitten vaak zo veel attributen dat je niet weet waar of hoe je moet zoeken. Je kunt met PowerPivot een rapport inladen, waarin de selecties en filteringen al door IT zijn gedaan en waarmee de gebruiker direct aan de slag kan".

Managed self-service

Rosenbrand: "De doelstelling van PowerPivot is 'managed selfservice BI'. De kracht naar de eindgebruikers brengen. Waar je vroeger naar IT moest omdat je een extra veldje in een rapport wilde hebben, kun je nu de data naar Excel halen en er een extra veld bij maken. Voor de gebruiker wordt het dus een stuk eenvoudiger. Voor de leverancier van BI-systemen zit daar echter een uitdaging in. Met self-service BI moetje een BI-omgeving uit de techniek trekken en gebruikersvriendelijker maken naar de eindgebruiker. PowerPivot vraagt om een andere architectuur, maar ook om een andere projectaanpak. Binnen Macaw hebben wij hiervoor het project BI 2.0 opgestart. Centraal in dit project staat het gebruikersvriendelijk aanbieden van brondata zodat de klant in staat is om na een halve dag begeleiding de eigen BI-omgeving uit te breiden en aan te passen. Ondertussen hebben wij dit concept bij verschillende klanten bewezen".

"De kwaliteit van het project en het product is na de introductie van PowerPivot nog belangrijker geworden. Self-service BI betekent dat het uiteindelijke product dat wordt opgeleverd volledig tranparant is. Je moet heel goed de business begrijpen, welke processen en welke informatie doet er echt toe? Waar wil de klant heen, zowel strategisch als tactisch, en waar zit het probleem? Deze inzichten zorgen ervoor dat klanten de informatie krijgen waarmee ze vandaag aan de slag kunnen, maar waarmee ze ook hun toekomstige vragen kunnen beantwoorden. Vanuit het technische oogpunt moet de BI-omgeving kwalitatief 100 procent zijn. Alle elementen in de BI-omgeving zijn zichtbaar voor verschillende eindgebruikers, het belang van bijvoorbeeld een eenduidige en functioneel correcte naamgeving is hierdoor in alle lagen groot.

Een ander BI gerelateerd kwaliteitsaspect is de integraliteit van de informatie. Een klant mag verwachten dat in de selfservice BI-omgeving één organisatiestructuur beschikbaar wordt gesteld die geïntegreerd is met alle onderliggende bronnen. In de praktijk blijkt regelmatig dat tijdens het inrichten en onderhouden van de systemen te weinig rekening is gehouden met deze integraliteit. In onze BI-architectuur zijn wij in staat om de klant te helpen om toch integraal te rapporteren en te analyseren.”

Rozema: "De focus verschuift van de vraag welk kleurtje het rapport moet hebben naar wat de relevante informatie is en hoe je die op een goede manier beschikbaar stelt aan de eindgebruiker. De visie van Microsoft op BI is dat BI voor iedereen in de organisatie beschikbaar moet zijn. Op dit ogenblik heeft circa tien procent van de medewerkers Business Intelligence tools tot zijn beschikking. Als je de functionaliteit verder wilt verspreiden betekent dat ook dat de IT of het Business Intelligence Competence Center niet meer aan alle verzoeken kan voldoen. Je zult je moeten beperken tot het aanbieden van informatie op een hapklare manier en de eindgebruiker er verder mee aan de slag laten gaan".

Gebruikers

"Er zijn wereldwijd zo'n 500 miljoen Office-gebruikers. Ongeveer vier procent daarvan maakt analyses met behulp van Excel. De overige 96 procent bestaat uit mensen die de analyses consumeren. De vier procent gaat heel veel hebben aan PowerPivot. De 96 procent hoeft geen sheets meer gemaild te krijgen, maar kan op het internet raadplegen wat de bouwers hebben bedacht. Het heeft dus niet voor alle Excel-gebruikers zin om PowerPivot te gaan gebruiken".

Cloud

De databronnen waaruit PowerPivot put kunnen ook afkomstig zijn van internet. Microsoft heeft het Open Data protocol (OData) ontwikkeld, dat is te vergelijken met RSS feeds. Op dezelfde technische basis werkt dit protocol met data. In PowerPivot kun je - als de aanbieder dit ondersteunt - de data uit de datafeed ophalen. Reporting services van SQL Server 2008 R2 ondersteunt ook de datafeeds. Met een enkele klik kan de onderliggende dataset van een rapport beschikbaar worden gesteld als datafeed. Hetzelfde geldt voor de lijstjes van SharePoint.

"De data die op het Azure cloud platform of op SQL Azure zijn opgeslagen, zijn eveneens via datafeeds bereikbaar. Ook IBM ondersteunt inmiddels het Open Data protocol. OData moet ertoe leiden dat we vrijer worden om informatie bij elkaar te brengen. Microsoft heeft een online Marketplace voor data ontwikkeld, Datamarket, dat draait op het Windows Azure cloud platform en volop gebruik maakt van OData. Hier kunnen allerlei aanbieders van informatie hun datasets ter beschikking stellen, al dan niet tegen betaling. Hieraan ligt de visie ten grondslag dat informatie overal ter wereld vrij beschikbaar moet zijn. Gecontroleerd door de aanbieder van de informatie, maar steeds gemakkelijker benaderbaar, te gebruiken, te combineren en te analyseren", zegt Rozema.

Zijn Macaw collega vult aan: "Het Reporting Services rapport datje als datafeed kunt exporteren maakt ook wel datje de klant goed moet begrijpen. Tot dusver hoefde je alleen te weten welke gegevens de klant in het rapport wilde hebben. Nu moetje rekening houden met vragen, die volgen op het zien van de informatie. Die wil je achter de dataset van het betreffende rapport hebben. We zien overigens gebeuren dat steeds meer businesses data van het internet ophalen".

Zakelijke markt

Microsoft beweegt zich met PowerPivot een stap dichter naar de zakelijke markt. Het bedrijf kwam ooit van de grond dankzij een besturingssysteem voor de PC. Zo'n vijftien jaar geleden heeft het de zakelijke markt betreden en inmiddels is het daar een grote speler. Verwacht wordt dat de ontwikkeling naar de zakelijke markt verder wordt doorgezet. Een nieuwe ontwikkeling is SQL Server Parallel Data Ware-house, dit is een datawarehouse appliance met een capaciteit van honderden Terabytes. Deze wordt inmiddels door HP onder de naam Enterprise Data Warehouse geleverd. Met R2 van SQL Server 2008 wordt de flexibiliteit in het beheer van de data aanzienlijk vergroot. Je kunt vanaf één plekje databases in het on-premise center en de data op de cloud beheren. De plaats van de data maakt niets meer uit.

Door: Robert de Ruiter

 

Partners