Inleiding tot de dimensietabel
Een dimensietabel is aanwezig in het ster- of sneeuwvlokschema. Dimensietabellen helpen om dimensies te beschrijven, dwz dimensiewaarden, attributen en sleutels. Het is over het algemeen klein van formaat. Grootte kan variëren van enkele tot duizend rijen. Het beschrijft de objecten die aanwezig zijn in de feitentabel. Dimensietabel verwijst naar de verzameling of groep informatie met betrekking tot een meetbare gebeurtenis. Ze vormen een kern voor dimensionale modellering. Het bevat een kolom die kan worden beschouwd als een primaire sleutelkolom die helpt om elke dimensierij of -record uniek te identificeren. Het wordt verbonden met de feitentabellen via deze sleutel. Wanneer deze wordt gemaakt, wordt een sleutel genaamd surrogaatsleutel die door het systeem wordt gegenereerd, gebruikt om de rijen in de dimensie op unieke wijze te identificeren.
Waarom moeten we gebruiken?
- Het helpt om de geschiedenis van de informatie of dimensionale informatie op te slaan.
- Het is gemakkelijk te begrijpen dan de genormaliseerde tabellen.
- Meer kolommen kunnen aan de tabel worden toegevoegd zonder de bestaande applicaties die deze gebruiken te beïnvloeden.
Soorten dimensietabel
Hier volgen de verschillende soorten dimensietabellen:
1. SCD (langzaam veranderende dimensies)
De dimensie-attributen die de neiging hebben langzaam met de tijd te veranderen in plaats van in een regelmatig tijdsinterval te veranderen, worden langzaam veranderende dimensies genoemd. Voor bijvoorbeeld adres- en telefoonnummerwijzigingen maar niet regelmatig. Laten we een voorbeeld bekijken van een man die naar verschillende landen reist, dus hij moet zijn adres volgens dat land wijzigen. Dit kan op drie manieren:
Type1: overschrijf de vorige waarde. Deze methode is eenvoudig toe te passen en helpt ruimte te besparen en dus kosten te besparen. Maar in dit scenario gaat de geschiedenis verloren.
De tabel voor de verandering
ID kaart | NAAM | LAND | NATIONALITEIT |
1001 | Rachel | Indië | Indisch |
Tabel na de verandering
ID kaart | NAAM | LAND | NATIONALITEIT |
1001 | Rachel | China | Indisch |
Type2: voeg een nieuwe rij toe met de nieuwe waarde. Bij deze methode wordt de geschiedenis opgeslagen en kan deze indien nodig worden gebruikt. Maar het neemt grote ruimte in beslag en verhoogt dus de kosten.
De tabel voor de verandering
ID kaart | NAAM | LAND | NATIONALITEIT |
1001 | Rachel | Indië | Indisch |
Tabel na de verandering
ID kaart | NAAM | LAND | NATIONALITEIT |
1001 | Rachel | Indië | Indisch |
1001 | Rachel | China | Indisch |
Type3: Voeg een nieuwe kolom toe. Het is de beste aanpak omdat de geschiedenis gemakkelijk kan worden onderhouden.
De tabel vóór Wijzigen
ID kaart | NAAM | LAND | NATIONALITEIT |
1001 | Rachel | Indië | Indisch |
Tabel na wijziging
ID kaart | NAAM | LAND | OUD LAND | NATIONALITEIT |
1001 | Rachel | China | Indië | Indisch |
2. Conforme dimensie
Deze dimensie wordt gedeeld tussen meerdere onderwerpgebieden of datamarts. Hetzelfde kan in verschillende projecten worden gebruikt zonder wijzigingen in hetzelfde. Dit wordt gebruikt om de consistentie te behouden. Geconformeerde dimensies zijn die die exact hetzelfde zijn of een juiste subset van een andere dimensie.
3. Ongewenste dimensie
Een ongewenste dimensie is een groep kenmerken van lage cardinaliteit. Het bevat verschillende of verschillende kenmerken die geen verband houden met een ander kenmerk. Deze kunnen worden gebruikt om RCD (snel veranderende dimensie) zoals vlaggen, gewichten etc. te implementeren.
4. Gedegenereerde dimensie
Het attributen die zijn opgeslagen in de feitentabel zelf en niet als een afzonderlijke dimensietabel, die attributen worden ontaarde dimensie genoemd. Voor bijvoorbeeld ticketnummer, factuurnummer, transactienummer etc.
5. Rollenspel dimensie
Het hebben van meerdere relaties met de feitentabel wordt rollenspeldimensie genoemd. Met andere woorden, het is wanneer dezelfde dimensiesleutel met alle bijbehorende attributen wordt samengevoegd met vele externe sleutelpresentaties in de feitentabel. Het kan meerdere doeleinden vervullen binnen dezelfde bestaande database.
Hoe werkt het in het datawarehouse?
- Dimensie verwijst naar de verzameling of groep informatie met betrekking tot een meetbare gebeurtenis. Ze vormen een kern voor dimensionale modellering. Wanneer een dimensie wordt gemaakt, wordt een structuur van een project gegenereerd. Gemaakt kan worden gebruikt voor verschillende projecten en weerspiegelt het idee van herbruikbaarheid. Als er een wijziging in wordt aangebracht, wordt het effect ervan alleen in die specifieke tabel weergegeven. Wanneer een rapport moet worden gemaakt, kan de gebruiker de gegevens gebruiken, aangezien dimensietabellen alle benodigde informatie bevatten.
- Bij het uitvoeren van dimensiemodellering worden de atoomgegevens in dimensionale structuren geladen. Vervolgens worden de dimensionale modellen gegenereerd of gebouwd rond de bedrijfsprocessen. Tijdens het maken moet er rekening mee worden gehouden dat domeinwaarden worden gefilterd en labels van de rapporten in deze tabellen worden opgeslagen. Er moet voor worden gezorgd dat de vervangende sleutel (door het systeem gegenereerde sleutel die wordt gebruikt tijdens het maken van de dimensietabel die helpt om elke record in de dimensietabel uniek te identificeren) moet worden gebruikt terwijl de dimensietabel wordt gemaakt. Het moet worden gedenormaliseerd omdat het hun taak is om de gebruiker de gegevens gemakkelijk even efficiënt te laten lezen en analyseren in plaats van transacties te beheren. Het belangrijkste doel van dimensie is het bieden van filtering, groepering en efficiënte labeling.
voordelen
Hieronder staan de verschillende voordelen van de dimensietabel:
- Het heeft een eenvoudige structuur.
- Het is gemakkelijk te analyseren en te begrijpen.
- Gedenormaliseerde gegevens.
- Helpt historische informatie voor elke dimensie te behouden.
- Gemakkelijk om er gegevens uit te halen.
- Snel te maken en te implementeren.
- Het geeft de context van elk bedrijfsproces weer.
Conclusie - dimensietabel
Dit is een integraal onderdeel van datamodellering. Het wordt gebruikt in een ster- of sneeuwvlokschema. Het bevat de dimensies, sleutels en waarden van de attributen van de feitentabel. Er zijn verschillende soorten die in verschillende scenario's worden gebruikt.
Aanbevolen artikelen
Dit is een handleiding voor de dimensietabel. Hier hebben we Typen besproken, hoe werkt Dimensietabel in het datawarehouse met Voordelen. U kunt ook onze andere gerelateerde artikelen doornemen voor meer informatie-
- Feitentabel versus dimensietabel
- Wat is feitentabel?
- Wat is Tableau?
- Data blending in Tableau