Introductie tot Star Schema

Het Star-schema is de eenvoudigste benadering en het dimensionale model waarbij de functietabellen, dimensies en feiten op een georganiseerde manier zijn gerangschikt en het meestal wordt toegepast in Business Intelligence en Data Warehousing. Een Star-schema wordt gevormd door elk feit te rangschikken met de bijbehorende dimensies die op een ster lijken. Een feit is een uitkomst die oneindig is, zoals verkoopdetails en inlogtellingen. Een dimensie is het verzamelen van referentiegegevens inclusief feiten, zoals datum, details over het product en klanten. Star-schema is geoptimaliseerd voor grote gegevensquery's in gegevensopslag, gegevensanalyses voor online analyse en ook ad-hocquery's.

Hoe maak je een sterrenschema?

Hier gaat de gebruiker Star Schema maken door conversie van het entiteit-relatiemodel. Entiteit-relatiemodellen zijn te complex om de functionele grootheden en attributen te verklaren, dus het is als volgt vereenvoudigd tot het dimensionale sterschema:

  • Zoek de enterprise-procedure vanuit entiteit-relatieweergave en begrijp het model dat kan worden opgesplitst in verschillende dimensionale modellen. Een entiteitsrelatie bestaat uit bedrijfsgegevens.
  • Vind veel tot veel tabellen in entiteitsrelatie die de bedrijfsprocedure verklaart en converteer ze naar dimensionale model realiteitstabellen. Deze tabel bevat gegevens bestaande uit de feitentabel en een dimensionale tabel met numerieke waarden en unieke sleutelkenmerken.
  • Het idee achter dit proces is om de op uitwisseling gebaseerde informatietabellen of de informatie gewiste tabellen te differentiëren. Het is dus noodzakelijk om vele tot talrijke relaties te ontwerpen. In de ERP-database zijn er bijvoorbeeld factuurgegevens die de ruiltabel zijn. Details die worden bijgewerkt en vernieuwd, zijn op uitwisseling gebaseerde tabellen. Nu beide tabellen worden vergeleken, is afgeleid dat de gegevens echt statisch zijn.
  • De realitytabel is een weergave van een dimensionaal model dat veel tot talloze netwerken tussen eindige metingen toont. Dit heeft tot gevolg dat externe sleutels in reality-tabellen veel tot veel delen, dat is een telbare relatie. het grootste deel van deze tabel valt onder op uitwisseling gebaseerde tabellen
  • De laatste stap bij het ontwerpen van het sterschema is om de verblijfstabellen te normaliseren in meettabellen. De verplichte sleutel is om een ​​dubbele sleutel te maken. Deze sleutel is afhankelijk van de realitytabel die helpt bij een beter begrip. Zoek de datum en tijd uit entiteitsrelatieontwerp en vul de dimensietabel in. Datums worden opgeslagen als datum- en tijdstempels. Een datumdimensiekolom vertegenwoordigt het jaar, de maand of de datum of tijd

Voorbeeld: de tijddimensionale tabel heeft TIMEID, Quartername, QuarterNo, MonthName, MonthNo, DayName, DayofMonth, DayOfWeek, wat belangrijke criteria van dimensionele tabellen kunnen zijn. Op dezelfde manier hebben alle tabellen unieke id en attributen. Query-talen zoals SQL kunnen worden toegepast op data mining, datawarehouse en data-analyse.

Syntaxis van kubusdefinitie:

Define cube (cube-name)(dimension-list): (measure-list)

Kubussen worden ingezet om de waarschuwingen op verschillende niveaus aan te pakken en de responstijd om de vraag te beantwoorden is minimaal. Het is beschikbaar als een vooraf gebouwd ontwerp en toepasbaar in de vereiste situaties. Het maken van een Star-schema is zeer eenvoudig en efficiënt toe te passen en kan ook worden aangepast. Het invullen van de feitentabel en de dimensionale tabel is verplicht, die op zijn beurt als ster wordt gevormd en kan worden gevormd met behulp van SQL-query's of lopende code. Dit ontwerp is gemaakt voor een beter begrip en het gemakkelijk ophalen van gegevens.

Kenmerken van sterrenschema

1. Het Star-schema biedt snelle aggregaties en berekeningen, zoals het totale aantal verkochte items en de inkomsten aan het einde van elke maand. Deze details en dit proces kunnen volgens de vereisten worden gefilterd door geschikte zoekopdrachten in te lijsten.

2. Het heeft de capaciteit om de gegevens uit genormaliseerde gegevens te filteren en te voorzien in behoeften aan gegevensopslag. De bijbehorende informatie van de genormaliseerde tabel is gestapeld op het tabblad met meerdere dimensies. Voor elke feitentabel wordt een unieke sleutel gegenereerd om elke rij te identificeren.

3. Feitentabel is de meting van specifieke gebeurtenissen inclusief eindige getalswaarden en bestaat uit buitenlandse sleutels met betrekking tot dimensionale tabellen. Deze tabel is omlijst met feitenwaarden op atomair niveau en laat toe meerdere records tegelijkertijd op te slaan. Er zijn drie verschillende soorten feitentabel.

4. Transactiefeitstabellen bestaan ​​uit gegevens over specifieke gebeurtenissen zoals vakantie-evenementen, verkoopgebeurtenissen.

5. Vastleggen van feiten voor bepaalde periodes zoals accountinformatie aan het einde van elk kwartaal.

6. Tabellen met snelle aggregatie voor een bepaalde periode worden accumulerende momentopnametabellen genoemd.

7. Dimensionale tabellen bieden gedetailleerde attribuutgegevens, records gevonden in feitentabel. De dimensietabel kan verschillende functies hebben. Maattabellen worden voornamelijk gebruikt als tijd- en datumafmetingen Maattabel, Product- en inkooporder Maattabel, Medewerker- en accountgegevens Maattabel, Aardrijkskunde en locaties Maattabel. Aan deze tabellen wordt een gegevenstype met één geheel getal toegewezen. Dit is de dubbele primaire sleutel.

8. De gebruiker kan zijn tafel ontwerpen volgens de vereisten. Als hij bijvoorbeeld een verkoopdimensionale tabel nodig heeft met product- en klantensleutel, datum- en tijdcode, de inkomsten uit gegenereerde sleutel. Als de zakenman een productdimensionale tabel omlijst met belangrijke kenmerken zoals kleur, datum van het gekochte artikel, promotiecode en klantcode.

voordelen

  • Het wordt gevormd met eenvoudige logica en query's die eenvoudig zijn om de gegevens uit het transactieproces te extraheren.
  • Het heeft een gemeenschappelijke rapportagelogica die dynamisch wordt geïmpliceerd.
  • Het Star-schema kan de prestaties voor rapportagetoepassingen verbeteren.
  • Star-schema ontworpen door het invoeren van kubussen die zijn toegepast door het online transactieproces om de kubussen effectief te maken en te laten werken.

nadelen

  • Het heeft een hoge integriteit en een hoge de-genormaliseerde toestand. Als de gebruiker de waarden niet bijwerkt, wordt het volledige proces samengevouwen. De beveiligingen en beveiliging zijn tot het uiterste niet betrouwbaar. Het is niet zo flexibel als een analytisch model en biedt geen efficiënte ondersteuning voor veel relaties.
  • Star-schema wordt in de database geïmplementeerd om het sneller herstel van gegevens te regelen. De query wordt gebruikt om de behoefte te selecteren in plaats van de hele database te doorzoeken. De gefilterde en geselecteerde gegevens kunnen in verschillende gevallen worden toegepast. Daarom is dit sterschema een eenvoudig model dat gemakkelijk kan worden overgenomen.

Aanbevolen artikel

Dit is een gids voor Wat is Star Schema? Hier bespreken we de inleiding tot het sterrenschema en de kenmerken ervan, samen met voor- en nadelen. U kunt ook onze andere voorgestelde artikelen doornemen voor meer informatie -

  1. Overzicht van feitentabel
  2. Star Schema vs Snowflake Schema | Top verschillen
  3. Modellen van datawarehouse met typen
  4. AWS-databases met voordelen
  5. AWS-gegevenspijplijn

Categorie: