Wat is het gegevensmodel?

De interpretatie en documentatie van bestaande softwareontwerp- en ontwikkelingsprocedures en transacties worden informatiemodellering genoemd. De methoden en instrumenten voor informatiemodellering vereenvoudigen de complexe systeemontwerpen om het opnieuw ontwerpen van informatie eenvoudiger te maken. Het wordt gebruikt om een ​​informatie-magazijn logisch en fysiek te ontwerpen. In dit onderwerp gaan we meer te weten komen over Data Warehouse Modelling.

Noodzaak van modellering van datawarehouse

  1. Verzameling van zakelijke vereisten
  2. Verbetering van de prestaties van de database
  3. Biedt documentatie van het bron- en doelsysteem

1. Verzameling van zakelijke vereisten

Een datawarehouse is meestal ontworpen om de entiteiten te bepalen die nodig zijn voor het datawarehouse en de feiten die moeten worden vastgelegd met de data-architecten en zakelijke gebruikers. Dit eerste ontwerp heeft veel iteratie voordat het definitieve model wordt bepaald.

Op dit moment moeten we de in de ontwerpfase voorkomende nadelen overwinnen. Aangezien een bestaand systeem een ​​datawarehouse implementeert, nemen architecten soms een groot deel van het oude systeem op in het nieuwe ontwerp, wat tijd of openbaarmaking bespaart.

Het logische model legt effectief de bedrijfsbehoeften vast en dient als basis voor het fysieke model.

2. Verbetering van de prestaties van de database

Controle van de efficiëntie is een essentieel kenmerk van een gegevensopslag. In een datawarehouse is enorme informatie betrokken, dus het is zeer essentieel om een ​​datamodelproduct te gebruiken voor metadata en datamanagement dat wordt gebruikt door BI-consumenten.

Het fysieke model voegt indexering toe om de efficiëntie van de database te optimaliseren. De schema's worden soms ook aangepast. Als een star-schema bijvoorbeeld sneller gegevensherstel belooft, kan het veranderen in een sneeuwvlokschema

3. Biedt documentatie van het bron- en doelsysteem

Bij het ontwikkelen van een ETL-systeem zijn de fysieke en logische modellen van de bron- en doelsystemen erg belangrijk om te controleren.

Deze documentatie wordt aangeboden door informatiemodellering als referentie voor de toekomst.

Conceptueel gegevensmodel

De hoogste relatie tussen de verschillende entiteiten wordt bepaald door een conceptueel gegevensmodel.

Het is de eerste stap naar het creëren van een top-down datamodel dat de precieze presentatie van de bedrijfsorganisatie weergeeft.

Ontwerp de totale databasestructuur en geeft een lijst van de onderwerpen

Bestaat uit de soorten en interacties van entiteiten. Symbolische notaties (IDEF1X of IE) vertegenwoordigen de verbinding tussen de onderwerpvelden. In een informatiemodel toont kardinaliteit de één op één of veel relaties

Model van relatiegegevens

Modellering van relatieve informatie in transactiegerichte OLTP-schema's wordt gebruikt. Een relationeel gegevensmodel heeft belangrijke kenmerken:

  • Gebruik van sleutel
  • Gegevensredundantie
  • Relatie tussen gegevens

Gebruik van sleutel

De belangrijkste sleutel in een tabel is de sleutel. Het wordt gebruikt als een enkele identificatie. Een niet-nul kolom is een primaire sleutel. Voor de hoofdsleutel wordt de externe sleutel gebruikt. Ze koppelen de informatie van de ene naar de andere tabel en maken verbinding.

Gegevensredundantie

Het relatie-informatiemodel past wetten voor informatie-integriteit toe

Gegevensredundantie is geëlimineerd. Een stukje informatie wordt niet herhaaldelijk verzameld. Dit zorgt voor consistentie van de gegevens en beperkte gegevensopslag

Relatie tussen gegevens

Alle gegevens worden opgeslagen in tabellen en elke relatie heeft kolommen en rijen.

Een kop en een lichaam moeten op de tafel liggen. De koptekst is de tabellijst met kolommen en de tabel bestaat uit de rijen. Het tupel is de enkele waarde die wordt geproduceerd door een kruising van kolom en rij.

Multidimensionaal gegevensmodel

Een organisatie die de belangrijke entiteiten van een bedrijf weerspiegelt en de verbinding daartussen, is een logisch perspectief van een multidimensionaal datamodel. De databases en tabellen zijn niet beperkt tot een natuurlijke database. De ER-diagrammen worden niet weergegeven.

  • attributen
  • feiten
  • Dimensie

een. Dimensie

  1. Een aspect is een gegevensverzameling die bestaat uit afzonderlijke informatiecomponenten die elkaar niet overlappen
  2. U kunt informatie instellen, groeperen en filteren voor eind- en kijkdoeleinden door eindgebruikers.

b. feiten

  1. Een tabel met kolommen die om numerieke redenen worden gebruikt om op bedrijfsproblemen te reageren.
  2. De maatregelen zijn additief, semi-additief en niet-additief

c. attributen

  1. De abstracte voorwaarden zijn bedoeld om de samenvatting van informatie in een onderzoek te vergemakkelijken
  2. Ze kunnen ook worden beschreven als kolomkoppen die niet zijn opgenomen in een rapportberekening.

Voordelen van het Dimensional-model

  1. Standaardisatie van dimensies maakt het gemakkelijk om over verschillende bedrijfsgebieden te rapporteren.
  2. Dimensionaal ook voor het opslaan van gegevens om het gemakkelijker te maken om gegevens uit de gegevens te halen wanneer de gegevens in de database zijn opgeslagen.
  3. Het bedrijf is zeer begrijpelijk voor het dimensionale model. Dit model is gebaseerd op bedrijfsvoorwaarden, zodat het bedrijf de betekenis van elke realiteit, elk aspect of elke functie begrijpt.
  4. Voor het snel opvragen van informatie worden dimensionale modellen gedeformaliseerd en geoptimaliseerd. Veel relatieplatforms erkennen dit model en optimaliseren de prestatieplannen van de query.
  5. Dimensionale modellen kunnen gemakkelijk worden aangepast. Dimensionale tabellen kunnen extra kolommen bevatten zonder het gebruik van deze tabellen door huidige bedrijfsintelligentie-apps te beïnvloeden.

Best Practices Datamodellering

Voordat met het gegevensmodel wordt begonnen, moet een volledige analyse van de behoeften van het klantbedrijf worden uitgevoerd. Het moet uiterst belangrijk zijn om de klanten te ontmoeten om eisen en technieken voor informatiemodellering te bespreken en om de specialisten van het bedrijf dit onmiddellijk te laten bevestigen.

Het bedrijf moet het gegevensmodel begrijpen, hetzij in een grafische / metagegevensindeling of als bedrijfsregels voor teksten.

Aanbevolen artikelen

Dit is een handleiding voor het modelleren van datawarehouse. Hier bespreken we het datamodel, waarom is het nodig in Data Warehousing, samen met de voordelen en typen modellen. U kunt ook het volgende artikel bekijken voor meer informatie -

  1. Data Warehouse-tools
  2. Typen datawarehouse
  3. Hulpmiddelen voor gegevensanalyse
  4. Data Science Tools
  5. Oracle Data Warehousing

Categorie: