Wat is Data Mart? - Typen, functies en stappen om Data Mart te implementeren

Inhoudsopgave:

Anonim

Inleiding tot Data Mart

De wereld wordt steeds meer digitaal en elke organisatie genereert meerdere petabytes aan gegevens. Data Mart is een dergelijke classificatie van gegevens uit een datawarehouse waar de concentratie op één onderwerp ligt.

We kunnen zeggen dat het gegevens zijn over één specifieke afdeling of categorie, zoals verkoop, financiën of marketing, enz. In feite is het een subset van datawarehousing. Omdat er concentratie is op specifieke onderwerpen of afdelingen, kunnen we zeggen dat de bron ervan beperkt is of afhankelijk is van zeer weinig bronnen.

Data Mart versus Data Warehouse

Een datawarehouse is een magazijn met een verzameling gegevens uit meerdere stromen van het onderwerp. Het onderhouds- en controlegedeelte, zoals het verzamelen en verwerken van onbewerkte gegevens, wordt voornamelijk afgehandeld door IT-groepen van bedrijfsinformatie die verschillende diensten verlenen aan de moederorganisaties.

Het datawarehouse wordt ook een centraal of enterprise datawarehouse genoemd. De bron voor een datawarehouse is dus meerdere in tegenstelling tot de data mart die in sommige gevallen een subset van datawarehouse is.

Typen gegevens Mart

Er zijn doorgaans drie soorten datamarts. Zij zijn:

1. Afhankelijke datawarehouse

Een afhankelijke datamart is puur uit het datawarehouse en alle gegroepeerde afhankelijkheden vormen een enterprise datawarehouse. Het is puur een subset van datawarehouse omdat het is gemaakt vanuit centrale DW.

Omdat schone en samengevatte gegevens al aanwezig zijn in het centrale datawarehouse ETT-proces of Extract Transform en Transport is vereenvoudigd. We moeten alleen de specifieke subset hier identificeren en er ETT bovenop uitvoeren.

Deze datamarts zijn meestal gebouwd om een ​​betere beschikbaarheid en veel verbeterde prestaties te bereiken met betere controle en efficiëntie.

2. Onafhankelijke gegevens Mart

Dit wordt niet gemaakt vanuit het centrale datawarehouse en de bron hiervoor kan verschillen. Aangezien de gegevens afkomstig zijn van andere dan het centrale DW ETT-proces, is dit een beetje anders.

Het grootste deel van de onafhankelijke datamart wordt gebruikt door een kleinere groep organisaties en de bron hiervoor is ook beperkt. De onafhankelijke datamart wordt meestal gemaakt wanneer we in relatief kortere tijd een oplossing moeten vinden.

3. Hybride gegevens Mart

Met Hybrid Data Mart kunt u de gegevens uit alle andere bronnen groeperen behalve het centrale datawarehouse DW. Wanneer we omgaan met ad-hocintegratie, zal dit enorm ten goede komen aan het beste werk voor alle producten die extern aan de organisaties zijn toegevoegd.

Kenmerken van Data Mart

Hieronder vindt u enkele kenmerken van een datamart:

  • Omdat de bron van de gegevens geconcentreerd is om te onderwerpen, wordt de responstijd van de gebruiker verbeterd door deze te gebruiken.
  • Voor vaak vereiste gegevens is het gebruik van datamarts voordelig omdat deze is onderverdeeld in centrale DW en daarom de gegevensgrootte kleiner is.
  • Omdat het volume van de gegevens beperkt is, zal de verwerkingstijd behoorlijk kort zijn in vergelijking met centrale Dws.
  • Deze zijn in principe wendbaar en kunnen de veranderingen in het model vrij snel en efficiënt verwerken in vergelijking met het datawarehouse.
  • Datamart vereist één expert op het gebied van vakken, in tegenstelling tot magazijngegevens, de expertise die we nodig hebben in magazijnen met meerdere vakken. Daarom zeggen we dat data mart flexibeler is.
  • We kunnen toegangscategorieën op een laag niveau scheiden met gepartitioneerde gegevens en met datamart is het heel eenvoudig.
  • De afhankelijkheid van de infrastructuur is vrij beperkt en gegevens kunnen bij segmentatie worden opgeslagen op verschillende hardwareplatforms.

Stappen om Data Mart te implementeren

Hieronder staan ​​de stappen die nodig zijn om het te implementeren.

1. Ontwerpen

Dit is de eerste stap in de implementatie waarbij alle vereiste taken en bronnen worden geïdentificeerd om technische en zakelijke informatie te verzamelen. Later wordt het logische plan geïmplementeerd en bij beoordeling wordt dit omgezet in een fysiek plan. Ook wordt hier de logische en fysieke structuur van de gegevens bepaald, zoals hoe de gegevens en het veld van de partitie zoals datum of een ander bestand worden verdeeld.

2. Constructie

Dit is de tweede implementatiefase waarin fysieke databases werden gegenereerd met behulp van RDBMS, dat werd bepaald als onderdeel van het ontwerpproces en logische structuren. Alle objecten zoals schema, indexen, tabellen, weergaven, enz. Worden gemaakt.

3. Bevolking

Dit is de derde fase en hier worden gegevens ingevuld bij het zoeken naar de gegevens. Alle vereiste transformaties worden geïmplementeerd voordat de gegevens erop worden ingevuld.

4. Toegang

Dit is de volgende implementatiestap waarbij we de gevulde gegevens zullen gebruiken om te zoeken naar rapporten. Eindgebruiker gebruikt deze stap om de gegevens te begrijpen met behulp van query's.

5. Beheer

Dit is de laatste fase van de implementatie van de datamart en hier worden verschillende taken geregeld, zoals toegangsbeheer, systeemoptimalisatie en afstemming, beheer en het toevoegen van nieuwe gegevens aan de datamart en het plannen van herstelscenario's om eventuele gevallen van storingen af ​​te handelen.

Voordelen van Data Mart

Hier volgen enkele voordelen van het gebruik ervan.

  • Het is een van de beste kosteneffectieve alternatieven voor een datawarehouse waar u slechts aan een klein segment gegevens hoeft te werken.
  • Segregatie van gegevens uit bronnen maakt datamart efficiënt omdat een specifieke groep mensen de gegevens van een specifieke bron kunnen verwerken in plaats van alle met behulp van het datawarehouse.
  • Snellere toegang tot de gegevens is mogelijk met behulp van datamart als we weten op welke subset we toegang moeten hebben.
  • Datamart is veel gemakkelijker te gebruiken, zodat eindgebruikers er eenvoudig op kunnen zoeken.
  • Voor de implementatietijd heeft data mart minder tijd nodig in vergelijking met het datawarehouse, omdat de gegevens in groepen zijn gescheiden.
  • Historische gegevens van een bepaald onderwerp kunnen worden gebruikt voor eenvoudige trendanalyse.

Conclusie

Omdat het geconcentreerd is op een enkel functioneel gebied, zijn er tal van voordelen voor zowel de procesimplementator als de eindgebruiker. Daarom is een efficiënte marts-implementatie vereist, samen met een datawarehouse in de organisatie.

Aanbevolen artikelen

Dit is een gids voor Wat is Data Mart. Hier bespreken we de introductie, functies en top 3-typen samen met de functies en stappen. U kunt ook de volgende artikelen bekijken voor meer informatie -

  1. Oracle Data Warehousing
  2. R Gegevenstypen
  3. Python-gegevenstypen
  4. Cassandra-gegevensmodellering
  5. Volledige gids voor datamodel in Cassandra