Trifacta heeft een nieuwe reeks mogelijkheden aangekondigd, specifiek gericht op het meer intelligent en efficiënt maken van datakwaliteitsbeoordeling, -herstel en -monitoring. Deze mogelijkheden zijn ontworpen om organisaties te helpen bij modernisering van hun aanpak van problemen met datakwaliteit die het succes van analyses, machine learning en cloud data management initiatieven belemmeren.
Omdat steeds meer behoefte is aan snellere inzichten en voorspellingen van ongelijksoortige gegevensbronnen, kunnen organisaties niet langer vertrouwen op legacy en in silo’s aanwezige datakwaliteitsprocessen om snelheid, schaal en diversiteit van hedendaagse data te verwerken. De eerste nieuwe mogelijkheid Active Profiling is een selectiemodel dat realtime visuele en interactieve begeleiding combineert met machine learning, waardoor gebruikers datakwaliteitskwesties kunnen ontdekken en ze kunnen oplossen met intelligente suggesties. De tweede is Smart Cleaning, een reeks nieuwe functies om problemen met datakwaliteit aan te pakken die zich voordoen bij het formatteren en standaardiseren. Met Cluster Clean, Pattern Clean en Reference Clean kunnen gebruikers kiezen uit verschillende intelligente cleaningmethoden.
Naarmate volumes en bronnen van data blijven toenemen, neemt ook het aantal geavanceerde machine learning-modellen en beschikbare analysetools toe. Het probleem is dat modellen voor machine learning en analysetools alleen zo goed zijn als de onderliggende data, en dat veel organisaties worstelen met problemen met de datakwaliteit. Het succes van de huidige machine learning en analytische initiatieven vereist een nieuwe benadering van datakwaliteit die zich richt op het vergroten van de snelheid, schaal en nauwkeurigheid van het opschonen en standaardiseren van gegevens. Naarmate organisaties datakwaliteitsprocessen moderniseren voor de machine learning en analytics use cases van vandaag, zal het slaagpercentage van deze initiatieven snel verbeteren in vergelijking met de momenteel lage succespercentages.
De nieuwe functies van Trifacta om initiatieven voor datakwaliteit verder te ondersteunen zijn:
Active Profiling
- Een nieuw selectiemodel creëert een naadloze ervaring die problemen met datakwaliteit benadrukt en biedt interactieve richtlijnen voor het oplossen van deze problemen.
- Kolomselectie biedt uitgebreide histogrammen, datakwaliteitsdiagrammen en patrooninformatie om direct inzicht te bieden in kolomdistributies en problemen met de datakwaliteit.
- Interactie met profileringsinformatie stimuleert suggesties en methoden voor het opschonen waar de gebruiker uit kan kiezen.
Smart Cleaning
- Cluster Clean gebruikt geavanceerde clusteralgoritmen om vergelijkbare waarden te groeperen en op te lossen tot een enkele standaardwaarde.
- Pattern Clean verwerkt samengestelde gegevenstypen zoals datums en telefoonnummers die vaak meerdere weergaven hebben.
- Met Reference Clean kunnen gebruikers een referentiedataset of dictionary specificeren, waarmee Trifacta waarden vergelijkt en standaardiseert.
Later in 2019 zal Trifacta zich richten op datakwaliteit naar het automationproces brengen. Met de uitrol van extra functionaliteit ter ondersteuning van flow orchestration, monitoring en alarmering, kunnen organisaties datakwaliteitspecificaties instellen en data isoleren die niet voldoen aan de datakwaliteitsnormen van de organisatie. Dit zal de strategie van het bedrijf om verder te gaan dan data preparation voortzetten door ondersteuning voor datakwaliteit toe te voegen en Trifacta naar een modern DataOps-platform uit te bouwen.
Meer informatie: Trifacta
19 en 20 mei 2022Praktische tweedaagse workshop met internationaal gerenommeerde spreker Alec Sharp over herkennen, beschrijven en ontwerpen van business processen. De workshop wordt ondersteund met praktijkvoorbeelden en duidelijke, herbruikbare ric...
30 mei t/m 1 juni 2022 Praktische workshop Data Management Fundamentals door Chris Bradley - CDMP-examinatie optioneel De DAMA DMBoK2 beschrijft 11 disciplines van Data Management, waarbij Data Governance centraal staat. De Certified Data Managemen...
8 juni 2022 Praktische workshop Datavisualisatie en Data-driven Storytelling. Hoe gaat u van data naar inzicht? En hoe gaat u om met grote hoeveelheden data, de noodzaak van storytelling, data science en de data artist? Lex Pierik behandelt de stromi...
8 - 10 juni 2022 - 3 halve dagen onlinePraktisch seminar met Barry Devlin over Data Mesh, -Fabric en -Lakehouse Data fabric, data mesh en data lakehouse bieden verschillende technologische oplossingen voor digitale transformatie. Inzicht in deze bena...
13 - 15 juni 2022Praktische driedaagse workshop met internationaal gerenommeerde trainer Lawrence Corr over het modelleren Datawarehouse / BI systemen op basis van dimensioneel modelleren. De workshop wordt ondersteund met vele oefeningen en praktijk...
6 oktober 2022 (online seminar op 1 middag)Praktische tutorial met Alec Sharp Alec Sharp illustreert de vele manieren waarop conceptmodellen (conceptuele datamodellen) procesverandering en business analyse ondersteunen. Waardevolle online tutor...
11 en 12 oktober 2022 Organisaties hebben behoefte aan data science, selfservice BI, embedded BI, edge analytics en klantgedreven BI. Vaak is het dan ook tijd voor een nieuwe, toekomstbestendige data-architectuur. Dit tweedaagse seminar geeft a...
13 oktober 2022Praktische workshop met Rogier Werschkull over cloud datawarehousing.Wat zijn de voor- en nadelen van Cloud Datawarehousing en hoe pak je dat aan? Tijdens dit seminar door expert Rogier Werschkull krijgt u een duidelijk beeld van de ve...
Deel dit bericht