13-12-2016 Door: Rick van der Lans

Datavirtualisatie is NIET hetzelfde als Datafederatie

Deel dit bericht

Er zijn mensen die beweren dat datavirtualisatie slechts een nieuwe naam voor datafederatie is; oude wijn in nieuwe zakken. Ik begrijp waar deze verwarring vandaan komt, maar ik ben het er absoluut niet mee eens.

Als we kijken naar de mogelijkheden en functies die ondersteund worden door enkele van de succesvolle datavirtualisatie-servers, dan ondersteunen zij de volgende runtime-functies:
• On-demand datafederatie
• On-demand datatransformatie
• On-demand data-integratie
• On-demand data-cleansing
• Gegevensbron-specifieke query-optimalisatie
• Netwerk-specifieke query-optimalisatie
• Caching

Daarnaast bieden zij de volgende functies voor ontwerp, ontwikkeling en beheer:
• Actieve lineage en impactanalyse
• Importeren van datamodellen
• Ondersteuning voor top-down, bottom-up en inside-out ontwikkelaanpakken
• Data model discovery
• Geïntegreerde data-profiling mogelijkheden
• Google-achtige zoekmogelijkheden voor gegevens en metagegevens
• Geïntegreerde business glossary

Uit deze twee lijsten blijkt duidelijk dat datafederatie een van de vele mogelijkheden is. Datafederatie wordt gebruikt als gegevens uit meerdere gegevensbronnen geïntegreerd moeten worden. Lang, lang geleden bestonden er producten die hun bestaan uitsluitend te danken hadden aan hun datafederatie-functie. Ze ondersteunden wel andere functies, maar dit was de belangrijkste. Deze datafederatie-producten werden nooit gebruikt als er geen behoefte aan datafederatie zou bestaan.

De huidige datavirtualisatie-servers ondersteunen uiteraard datafederatie, en waarschijnlijk op een geavanceerdere manier dan de oudere datafederatie-producten ooit hebben gedaan, maar het is slechts één van de vele functies die ze ondersteunen (zoals uit de lijstjes blijkt). Datavirtualisatie heeft veel meer te maken met abstractie. De specifieke technische eigenschappen van gegevensbronnen worden verhuld. En daar zijn veel functies voor nodig, waarvan datafederatie er één is.

Sommige organisaties die een datavirtualisatie-server gebruiken, maken niet eens gebruik van de datafederatie-mogelijkheden, maar puur van de data-abstractie functies. Bijvoorbeeld, als een datavirtualisatie-server wordt ingezet om een datavault-gebaseerd datawarehouse on-demand om te zetten naar een starschema-model, dan wordt datafederatie-functionaliteit niet ingezet maar alleen de abstractiemogelijkheden.

De conclusie is dat datafederatie een van de vele functies van een datavirtualisatie-server is. De twee zijn geen synoniemen van elkaar.

Rick van der Lans

Rick van der Lans is onafhankelijk adviseur, docent en auteur op het terrein van datawarehousing, business intelligence, big data en databasetechnologie. Als consultant heeft hij door de jaren heen veel grote bedrijven geadviseerd bij het ontwerpen van hun datawarehouse- en big data architecturen. Rick heeft als spreker op conferenties een zeer goede naam verworven zowel in binnen- als buitenland en is chairman van de jaarlijkse Datawarehousing & BI Summit.  Hij weet als geen ander een goede balans te vinden tussen op de praktijk toegesneden technologische ontwikkelingen en strategische zaken. Hij schrijft voor diverse bekende websites waaronder BI-Platform. Verschillende van zijn boeken, waaronder het populaire "SQL Leerboek", zijn in vele talen gepubliceerd. Recent is van zijn hand verschenen "Data Virtualization for Business Intelligence Systems", alsook tientallen whitepapers over BI. Rick verzorgt bij Adept Events een seminar over Hadoop, NoSQL en Big Data alsmede een seminar over de architectuur, ontwerp en technologie van het Logisch Datawarehouse.

Alle blogs van deze auteur

Partners