Verschil tussen Star Schem a vs Snowflake Schema

In dit artikel zullen we star-schema versus sneeuwvlok-schemaverschillen in detail bespreken. Schema is de manier om de volledige databases of datawarehouses logisch te beschrijven met behulp van relationele databases. De beschrijving kan de naam en details van de records van elk type met alle aggregaten en gegevensitems bevatten. Data warehouses gebruiken Star, Snowflake, Fact Constellation en Galaxy schema.

Sterschema

Het is het eenvoudigste datawarehouse-schema. Zoals de naam al doet vermoeden, lijkt de structuur op een ster. In dit schema is de feitentabel in het midden aanwezig en is het aantal dimensietabellen hieraan gekoppeld via een externe sleutel en bevat de dimensietabel de set attributen. In dit schema wordt elke dimensie weergegeven met slechts één dimensietabel, maar zijn de dimensietabellen niet met elkaar verbonden. De voordelen hiervan zijn onder meer snijden, eenvoudig inzicht in gegevens, optimaal schijfgebruik en prestatieverbetering. Laten we een voorbeeld zien voor een beter begrip.

Voorbeeld:

Overweeg een koelkastfabrikant en we moeten een schema opstellen voor de verkoop van deze koelkastfabrikant. Verkoop heeft de volgende dimensies:

  • Item
  • Plaats
  • Afdeling
  • Tijd

Het schema heeft een feitentabel in het midden voor de verkoop die sleutels zou bevatten om aan elke dimensie te koppelen, met twee maten, namelijk verkochte eenheden en verkochte dollars.

Sneeuwvlok schema

Sneeuwvlokschema is de uitbreiding van het sterrenschema. Het voegt er extra dimensies aan toe. Zoals de naam al doet vermoeden, lijkt het op een sneeuwvlok. In dit schema zijn de dimensietabellen genormaliseerd, dwz gegevens worden opgesplitst in extra tabellen. Het opsplitsen van de tafel vermindert redundantie en geheugenverspilling. Het heeft de hiërarchische vorm van dimensionale tabellen. De dimensie- en subdimensietabellen zijn gekoppeld aan de primaire en externe sleutels in de feitentabel. Het is eenvoudiger te implementeren en gebruikt minder schijfruimte. Omdat het meerdere tabellen heeft, zijn de prestaties van de zoekopdracht minder. Meer onderhoud is vereist omdat er meer opzoektabellen zijn. Laten we een voorbeeld zien voor een beter begrip.

Voorbeeld:

Overweeg hetzelfde voorbeeld als hierboven van het koelkastproducerende bedrijf, in het sneeuwvlokkenschema is de feitentabel dezelfde als in het sterschema, maar het belangrijkste verschil zit in de definitie of lay-out van dimensietabellen.

In dit schema is de tabel met één dimensie van het artikel genormaliseerd en gesplitst en is er een nieuwe leverancierstabel gemaakt met informatie over het type leverancier. Evenzo wordt de dimensietabel van de locatie genormaliseerd en worden gegevens opgesplitst in een nieuwe stadstabel met details van de specifieke stad.

Head-to-Head vergelijking tussen Star Schema en Snowflake Schema (Infographics)

Hieronder staan ​​de top 9 verschillen tussen Star Schema versus Snowflake Schema.

Belangrijkste verschillen tussen Star Schema versus Snowflake Schema

Laten we een paar belangrijke verschillen zien tussen Star Schema en Snowflake Schema.

Sterschema:

  • Dimensiehiërarchieën in sterschema worden opgeslagen in de dimensietabel.
  • Het bevat een centrale feitentabel omringd door dimensietabel.
  • Hierin associeerde een enkele join de feitentabel met een dimensietabel.
  • Het heeft een eenvoudig ontwerp.
  • De gegevensstructuur is gedenormaliseerd.
  • De query wordt sneller uitgevoerd.
  • In deze kubus verloopt de verwerking sneller.
  • Het heeft meer overbodige gegevens.
  • Het maakt gebruik van eenvoudige vragen.
  • Star-schema is gemakkelijk te begrijpen.
  • In een sterschema wordt meer ruimte verbruikt.

Sneeuwvlokschema:

  • Hiërarchieën in een sneeuwvlokschema worden opgeslagen in afzonderlijke tabellen.
  • Het bevat ook een feitentabel omringd door dimensietabel en deze dimensietabellen worden verder omgeven door een dimensietabel.
  • In dit schema zijn veel joins nodig om de gegevens op te halen.
  • Het heeft een complex ontwerp.
  • De gegevensstructuur is genormaliseerd in het sneeuwvlokschema.
  • De query wordt relatief langzamer uitgevoerd dan star schema.
  • In het sneeuwvlokschema verloopt de verwerking van kubussen langzamer.
  • Het bevat minder overbodige gegevens.
  • Het maakt gebruik van complexe vragen.
  • Het sneeuwvlokschema is relatief moeilijk om dat sterschema te begrijpen.
  • In het sneeuwvlokschema wordt minder ruimte verbruikt.

Vergelijkingstabel met sterschema versus sneeuwvlokschema

Laten we de vergelijkingen tussen Star Schema versus Snowflake Schema bespreken.

karakteristiek

Sterschema

Sneeuwvlok schema

Onderhoud / ChangeHet heeft meer redundante gegevens en daarom is het moeilijker te wijzigen of te onderhoudenDit schema is gemakkelijker te wijzigen en te onderhouden vanwege minder redundantie
begrijpelijkheidDe complexiteit van de query is minder en daarom is het gemakkelijk te begrijpenToegepaste zoekopdrachten zijn complexer en daarom moeilijk te begrijpen
Query-uitvoeringstijdHet heeft minder externe sleutels en daarom is de query-uitvoering sneller en kost het minder tijdVanwege meer externe sleutels is de uitvoeringstijd van de zoekopdracht langer of wordt de zoekopdracht langzaam uitgevoerd
Type datawarehouseBeter voor datamarts met een enkele relatie, dat wil zeggen één op één of één op veelBeter voor complexe relaties, dwz veel tot veel relaties
Aantal JoinsHet heeft meer aantal joinsHet heeft minder aantal joins
DimensietabelHet heeft slechts één dimensietabel voor elke dimensieHet heeft een of meer dimensietabellen voor een enkele dimensie
UsabilityAls de afmeting van de dimensietabel kleiner is, oftewel minder aantal rijen, heeft een ster schema de voorkeurGoed om te gebruiken wanneer de afmetingstabel groter is
Normalisatie en denormalisatieZowel de feitentabel als de dimensietabellen zijn gedenormaliseerd.Een feitentabel wordt gedenormaliseerd terwijl de dimensietabel wordt genormaliseerd
GegevensmodelHet volgt een top-downbenaderingHet volgt een bottom-up benadering

Conclusie

In dit artikel hebben we de Star Schema versus Snowflake Schema in detail besproken. Deze schema's worden gebruikt om het datawarehouse weer te geven. Ze zijn vergelijkbaar in sommige aspecten en verschillend in andere. Sneeuwvlok is de uitbreiding van het sterrenschema. Wanneer gegevens meer zijn, heeft sneeuwvlok de voorkeur omdat het redundantie vermindert, maar de ster is relatief populairder dan sneeuwvlokschema.

Aanbevolen artikelen

Dit is een gids voor Star Schema vs Snowflake Schema. Hier bespreken we ook de belangrijkste verschillen tussen Star Schema en Snowflake Schema met infographics en vergelijkingstabel. U kunt ook onze andere voorgestelde artikelen doornemen voor meer informatie -

  1. Codering versus decodering - Topverschillen
  2. Verschil tussen kleine gegevens versus grote gegevens
  3. Functioneel testen versus niet-functioneel testen
  4. Rook testen versus gezondheidsonderzoek
  5. Wat is gezondheidstesten en hoe werkt het?