Data Warehouse-ontwerp - Top 8 gebruik van datawarehouse-ontwerp

Inhoudsopgave:

Anonim

Inleiding tot het Data Warehouse-ontwerp

Een magazijn in gewone woorden betekent, iets op één plaats opslaan en vergelijkbare gevallen in industrieën om de complexe hoeveelheid gegevens op één locatie op te slaan. Met Business Intelligence (BI) kunt u gegevens uit de gegevensbronnen opvragen en vertrouwen kan alleen worden gesteld als er een goed datawarehouse-ontwerp is.

Het datawarehouse integreert meerdere gegevensbronnen en biedt een goede ondersteuning voor analyse en analytische rapportage. Als u een slecht datawarehouse-ontwerp hebt, heeft dit invloed op de groei van uw organisatie door onnauwkeurige querygegevens te hebben.

Neem een ​​voorbeeld van populariteit van de Amazon-webwinkel door het artikel te bestellen en het kan bij onze deur worden bezorgd. Wanneer de klant zich aanmeldt bij de e-commerce-site en naar het beschikbare product in de winkel zoekt. Vervolgens hebben we het item geselecteerd en besteld, zodra de leverancier dit accepteert en onmiddellijk wordt verzonden. Hier kunnen we onze tijd besparen om het gewenste artikel te kopen.

Een vergelijkbaar geval met dit gegevensmagazijn, de gegevens kunnen worden opgeslagen en verkregen van het transactiesysteem. Het datawarehouse als een twee hoofdconcept

  • OLAP - Online analytische verwerking
  • OLTP - Online transactieverwerking

Beide zijn online verwerkingssystemen, maar hebben enkele verschillen. OLTP beheert de transactionele applicatie zoals ATM, OLAP gebruikt voor analytische verwerking zoals rapportage, voorspelling, enz.,

Vereisten verzamelen

  • Het verzamelen van vereisten is een fase in het ontwerp van het datawarehouse. Het moet de criteria bepalen en met succes implementeren. Er zullen twee strategieën worden gebruikt voor het ontwerpen van datawarehouses, een heet het bedrijf en een andere wordt technisch genoemd.
  • De bedrijfsstrategie is gericht op de langetermijnvisie en helpt de winst voor groei te vergroten. De technische strategievereiste is gebaseerd op gebruikersrapportage, analyse, hardwareselectie, ontwikkelingsmethode, testtechniek, implementatieomgeving en training van gebruikers.
  • Toen we de zakelijke en technische strategie bepaalden, moeten we ook het BCP-plan (Disaster Recovery) ontwerpen. Wanneer er zich een ramp voordoet door mens of natuur, moeten we een plan hebben om de gegevens snel te herstellen en ervoor te zorgen dat er geen gegevens verloren gaan. Het ontwikkelen van het noodherstelplan is een van de uitdagingen en geeft vertrouwen aan de organisatie.

Omgeving instellen

  • Nadat we de gegevens voor het datawarehouse-ontwerp hebben verzameld, moeten we een juiste omgeving instellen voor ontwikkeling, testen en productie. Bij voorkeur zou er een apart systeem voor applicatie, database en ook voor rapportage / ETL moeten zijn.
  • Wanneer we voor elke omgeving een afzonderlijke omgeving bouwen, zorgen we ervoor dat alle wijzigingen kunnen worden ontwikkeld / getest en vervolgens doorgaan naar productie.
  • Als we een enkele omgeving hebben die is ontworpen voor al deze activiteiten, kan dit leiden tot problemen en gegevensverlies. Wanneer er zich bijvoorbeeld een incident in het systeem heeft voorgedaan, konden we niet navigeren en de manier vinden om het probleem op te lossen en dit maakt het complexer.

Gegevensmodellering

  • Zodra het verzamelen van de vereisten en de omgeving is ingesteld, is het volgende om te ontwerpen hoe de gegevensbron, het proces en de opslag in het gegevensmagazijn worden verbonden. Deze techniek wordt genoemd als gegevensmodellering. Het kan een analyse van het object en de relatie tussen de anderen zijn.
  • Bij het ontwerp van het datawarehouse hebben de ingenieurs ontworpen hoe en waar de gegevens moeten worden opgeslagen. Bij dezelfde gelegenheid moeten we ook de mogelijke manier definiëren om de gegevens uit het datawarehouse op te halen. Zodra de bron is geïdentificeerd, kan het team de logica bouwen en een structuurschema maken.

Typen gegevensmodel

Er zijn drie soorten

  • conceptuele
  • Logisch
  • fysiek

De drie soorten gegevensmodellen worden hieronder vermeld:

1. Conceptueel: er staat WAT het systeem bevat en het is ontworpen door bedrijfsarchitecten om de reikwijdte van de bedrijfsstrategie te definiëren.

2. Logisch: dit definieert HOE de logica kan worden gemaakt in DBMS, deze wordt ontworpen door Business Analyst en Data Architect om een ​​set regels te maken om de gegevens op te slaan / op te halen

3. Fysiek: dit bepaalt hoe het systeem kan worden geïmplementeerd.

Gebruik van Data Warehouse-ontwerp

Een goed datawarehouse-ontwerp zijn, kan tijdrovend zijn bij het ophalen van de gegevens. Elke stap moet effectief volgen om het systeem goed te maken. Het zal de organisatie helpen om de complexe soorten gegevens te verwerken en de productiviteit te verbeteren op basis van de trendanalyse. Dus elke stap in DWH-architectuurontwerp is belangrijk en bewuster in de selectiemethode. De organisatie stapt vervolgens in elke stroom en leidt tot een succesvolle implementatie van het datawarehouse.

Er zijn enkele belangrijke toepassingen van Data Warehouse

1. Banksector: de meeste banken gebruiken het datawarehouse voor het opslaan van een grote hoeveelheid transactiegegevens en de mogelijkheid om de querygegevens veel sneller op te halen. Het kan worden beheerd zoals klantgegevens, markttendensen, rapporten, analyses, enz.,

2. Financiële sector: het lijkt op bankieren, maar de enige focus is het verbeteren van financiële veranderingen door de klantgegevens te analyseren

3. Overheid: tegenwoordig beheert de overheid veel gegevens online en slaat ze op in de relationele database. Elke data heeft een relatie met elkaar zoals Aadhaar, PAN is gekoppeld aan vele bronnen.

4. Gezondheidszorg: Gezondheidszorgmanagers en diensten bieden zoveel informatie. Het onderhoudt de klinische details, klantendossiers en helpt hen om de resultaten te voorspellen, de feedback te analyseren en de rapporten te genereren.

5. Verzekering: verzekeringsmaatschappij die voornamelijk wordt gebruikt voor gegevenspatronen, klantentrends en het bijhouden van gegevens.

6. Productie- en distributie-industrie: het wordt het meest gebruikt in alle industrieën voor het opslaan van artikelinformatie en helpt hen om het vraagartikel voor productie en verkoop te voorspellen. Het analyseren van het verkochte item dat betere besluitvormingstechnieken geeft.

7. Retailers Services: Retailers zijn de tussenpersoon tussen de producent en de klant. Datawarehouse helpt hen bij promoties en het kopen van artikelen.

8. Telefoonindustrie: telefoonindustrieën beheren veel historische gegevens die helpen om de klantgegevens trend en doelgerichter te maken om reclamecampagnes te stimuleren.

Voordelen van Data Warehouse

  • Levert verbeterde bedrijfsinformatie
  • Zorgt voor datakwaliteit en consistentie
  • Bespaart tijd en geld
  • Tracks historisch intelligente gegevens
  • Genereert hoge ROI

Nadeel van Data Warehouse

  • Extra rapportwerk
  • Inflexibiliteit en homogenisatie van gegevens
  • Bezorgdheid over eigendom
  • Eist grote hoeveelheden middelen
  • Verborgen problemen kosten tijd

Aanbevolen artikelen

Dit is een gids voor Data Warehouse Design. Hier bespreken we de datawarehouse-ontwerptechniek, het verzamelen van vereisten, het instellen van de omgeving, het gebruik, het voordeel / nadeel. U kunt ook het volgende artikel bekijken voor meer informatie -

  1. Voordelen van Data Warehouse
  2. Implementatie van datawarehouse
  3. Modellen van datawarehouse
  4. Data Warehouse-tools
  5. Top 4 verschillende soorten datamodellen