13-12-2016 Door: Rick van der Lans

Datavirtualisatie is NIET hetzelfde als Datafederatie

Deel dit bericht

Er zijn mensen die beweren dat datavirtualisatie slechts een nieuwe naam voor datafederatie is; oude wijn in nieuwe zakken. Ik begrijp waar deze verwarring vandaan komt, maar ik ben het er absoluut niet mee eens.

Als we kijken naar de mogelijkheden en functies die ondersteund worden door enkele van de succesvolle datavirtualisatie-servers, dan ondersteunen zij de volgende runtime-functies:
• On-demand datafederatie
• On-demand datatransformatie
• On-demand data-integratie
• On-demand data-cleansing
• Gegevensbron-specifieke query-optimalisatie
• Netwerk-specifieke query-optimalisatie
• Caching

Daarnaast bieden zij de volgende functies voor ontwerp, ontwikkeling en beheer:
• Actieve lineage en impactanalyse
• Importeren van datamodellen
• Ondersteuning voor top-down, bottom-up en inside-out ontwikkelaanpakken
• Data model discovery
• Geïntegreerde data-profiling mogelijkheden
• Google-achtige zoekmogelijkheden voor gegevens en metagegevens
• Geïntegreerde business glossary

Uit deze twee lijsten blijkt duidelijk dat datafederatie een van de vele mogelijkheden is. Datafederatie wordt gebruikt als gegevens uit meerdere gegevensbronnen geïntegreerd moeten worden. Lang, lang geleden bestonden er producten die hun bestaan uitsluitend te danken hadden aan hun datafederatie-functie. Ze ondersteunden wel andere functies, maar dit was de belangrijkste. Deze datafederatie-producten werden nooit gebruikt als er geen behoefte aan datafederatie zou bestaan.

De huidige datavirtualisatie-servers ondersteunen uiteraard datafederatie, en waarschijnlijk op een geavanceerdere manier dan de oudere datafederatie-producten ooit hebben gedaan, maar het is slechts één van de vele functies die ze ondersteunen (zoals uit de lijstjes blijkt). Datavirtualisatie heeft veel meer te maken met abstractie. De specifieke technische eigenschappen van gegevensbronnen worden verhuld. En daar zijn veel functies voor nodig, waarvan datafederatie er één is.

Sommige organisaties die een datavirtualisatie-server gebruiken, maken niet eens gebruik van de datafederatie-mogelijkheden, maar puur van de data-abstractie functies. Bijvoorbeeld, als een datavirtualisatie-server wordt ingezet om een datavault-gebaseerd datawarehouse on-demand om te zetten naar een starschema-model, dan wordt datafederatie-functionaliteit niet ingezet maar alleen de abstractiemogelijkheden.

De conclusie is dat datafederatie een van de vele functies van een datavirtualisatie-server is. De twee zijn geen synoniemen van elkaar.

Rick van der Lans

Rick van der Lans is een gerespecteerd en onafhankelijk analist, adviseur, auteur en internationaal bekende spreker. Hij is gespecialiseerd in datawarehousing, business intelligence, big data en databasetechnologie. Hij heeft vele seminars en webinars gepresenteerd en keynotes bij industry-leading conferenties. Hij weet als geen ander een goede balans te vinden tussen op de praktijk toegesneden technologische en strategische zaken. Al meer dan tien jaar is hij de voorzitter van de jaarlijkse European Enterprise Data and Business Intelligence Conference in Londen en de jaarlijkse Data Warehousing en Business Intelligence Summit in Nederland. Rick helpt cliënten wereldwijd met het ontwerpen van hun data warehouse, big data en business intelligence architecturen en begeleid hen bij het selecteren van de geschikte producten. Hij is invloedrijk geweest bij het wereldwijd introduceren van de nieuwe logische datawarehouse architectuur waarmee organisaties meer flexibele business intelligence systemen kunnen ontwikkelen. Rick heeft honderden artikelen en blogs geschreven voor toonaangevende vakbladen en websites en van zijn hand zijn vele educatieve en populaire whitepapers verschenen voor een groot aantal leveranciers. Hij was de auteur van het eerste beschikbare boek over SQL, getiteld Introduction to SQL, dat in vele talen gepubliceerd is en waarvan meer dan 100.000 exemplaren verkocht zijn. Recentelijk publiceerde hij het boek Data Virtualization for Business Intelligence Systems.

Rick verzorgt bij Adept Events een seminar over de architectuur, ontwerp en technologie van het Logisch Datawarehouse alsmede een seminar over het Ontwerpen van Nieuwe Data Architecturen.

Alle blogs van deze auteur

Partners