Trifacta heeft een nieuwe reeks mogelijkheden aangekondigd, specifiek gericht op het meer intelligent en efficiënt maken van datakwaliteitsbeoordeling, -herstel en -monitoring. Deze mogelijkheden zijn ontworpen om organisaties te helpen bij modernisering van hun aanpak van problemen met datakwaliteit die het succes van analyses, machine learning en cloud data management initiatieven belemmeren.
Omdat steeds meer behoefte is aan snellere inzichten en voorspellingen van ongelijksoortige gegevensbronnen, kunnen organisaties niet langer vertrouwen op legacy en in silo’s aanwezige datakwaliteitsprocessen om snelheid, schaal en diversiteit van hedendaagse data te verwerken. De eerste nieuwe mogelijkheid Active Profiling is een selectiemodel dat realtime visuele en interactieve begeleiding combineert met machine learning, waardoor gebruikers datakwaliteitskwesties kunnen ontdekken en ze kunnen oplossen met intelligente suggesties. De tweede is Smart Cleaning, een reeks nieuwe functies om problemen met datakwaliteit aan te pakken die zich voordoen bij het formatteren en standaardiseren. Met Cluster Clean, Pattern Clean en Reference Clean kunnen gebruikers kiezen uit verschillende intelligente cleaningmethoden.
Naarmate volumes en bronnen van data blijven toenemen, neemt ook het aantal geavanceerde machine learning-modellen en beschikbare analysetools toe. Het probleem is dat modellen voor machine learning en analysetools alleen zo goed zijn als de onderliggende data, en dat veel organisaties worstelen met problemen met de datakwaliteit. Het succes van de huidige machine learning en analytische initiatieven vereist een nieuwe benadering van datakwaliteit die zich richt op het vergroten van de snelheid, schaal en nauwkeurigheid van het opschonen en standaardiseren van gegevens. Naarmate organisaties datakwaliteitsprocessen moderniseren voor de machine learning en analytics use cases van vandaag, zal het slaagpercentage van deze initiatieven snel verbeteren in vergelijking met de momenteel lage succespercentages.
De nieuwe functies van Trifacta om initiatieven voor datakwaliteit verder te ondersteunen zijn:
Active Profiling
- Een nieuw selectiemodel creëert een naadloze ervaring die problemen met datakwaliteit benadrukt en biedt interactieve richtlijnen voor het oplossen van deze problemen.
- Kolomselectie biedt uitgebreide histogrammen, datakwaliteitsdiagrammen en patrooninformatie om direct inzicht te bieden in kolomdistributies en problemen met de datakwaliteit.
- Interactie met profileringsinformatie stimuleert suggesties en methoden voor het opschonen waar de gebruiker uit kan kiezen.
Smart Cleaning
- Cluster Clean gebruikt geavanceerde clusteralgoritmen om vergelijkbare waarden te groeperen en op te lossen tot een enkele standaardwaarde.
- Pattern Clean verwerkt samengestelde gegevenstypen zoals datums en telefoonnummers die vaak meerdere weergaven hebben.
- Met Reference Clean kunnen gebruikers een referentiedataset of dictionary specificeren, waarmee Trifacta waarden vergelijkt en standaardiseert.
Later in 2019 zal Trifacta zich richten op datakwaliteit naar het automationproces brengen. Met de uitrol van extra functionaliteit ter ondersteuning van flow orchestration, monitoring en alarmering, kunnen organisaties datakwaliteitspecificaties instellen en data isoleren die niet voldoen aan de datakwaliteitsnormen van de organisatie. Dit zal de strategie van het bedrijf om verder te gaan dan data preparation voortzetten door ondersteuning voor datakwaliteit toe te voegen en Trifacta naar een modern DataOps-platform uit te bouwen.
Meer informatie: Trifacta
7 november (online seminar op 1 middag)Praktische tutorial met Alec Sharp Alec Sharp illustreert de vele manieren waarop conceptmodellen (conceptuele datamodellen) procesverandering en business analyse ondersteunen. En hij behandelt wat elke data-pr...
11 t/m 13 november 2024Praktische driedaagse workshop met internationaal gerenommeerde trainer Lawrence Corr over het modelleren Datawarehouse / BI systemen op basis van dimensioneel modelleren. De workshop wordt ondersteund met vele oefeningen en pr...
18 t/m 20 november 2024Praktische workshop met internationaal gerenommeerde spreker Alec Sharp over het modelleren met Entity-Relationship vanuit business perspectief. De workshop wordt ondersteund met praktijkvoorbeelden en duidelijke, herbruikbare ...
26 en 27 november 2024 Organisaties hebben behoefte aan data science, selfservice BI, embedded BI, edge analytics en klantgedreven BI. Vaak is het dan ook tijd voor een nieuwe, toekomstbestendige data-architectuur. Dit tweedaagse seminar geeft antwoo...
De DAMA DMBoK2 beschrijft 11 disciplines van Data Management, waarbij Data Governance centraal staat. De Certified Data Management Professional (CDMP) certificatie biedt een traject voor het inleidende niveau (Associate) tot en met hogere niveaus van...
3 april 2025 (halve dag)Praktische workshop met Alec Sharp [Halve dag] Deze workshop door Alec Sharp introduceert conceptmodellering vanuit een non-technisch perspectief. Alec geeft tips en richtlijnen voor de analist, en verkent datamodellering op c...
10, 11 en 14 april 2025Praktische driedaagse workshop met internationaal gerenommeerde spreker Alec Sharp over herkennen, beschrijven en ontwerpen van business processen. De workshop wordt ondersteund met praktijkvoorbeelden en duidelijke, herbruikba...
15 april 2025 Praktische workshop Datavisualisatie - Dashboards en Data Storytelling. Hoe gaat u van data naar inzicht? En hoe gaat u om met grote hoeveelheden data, de noodzaak van storytelling en data science? Lex Pierik behandelt de stromingen in ...
Deel dit bericht