10 essentiële vragen over datawarehousing (bijgewerkt voor 2019)

Inhoudsopgave:

Anonim

Inleiding tot interviewvragen en antwoorden op data warehousing

Wat is een datawarehouse?

Data-warehouse is een centrale repository die heterogene data uit verschillende bronnen opslaat. De gegevens in een magazijn kunnen worden gebruikt voor analytische rapportage, gestructureerde of ad hoc-vragen en worden gebruikt bij de besluitvorming. Het proces van het verzamelen van gegevens uit meerdere bronnen en het opslaan ervan in de centrale repository wordt Data Warehousing genoemd.

De gegevens kunnen van verschillende typen zijn, zoals gestructureerde, semi-gestructureerde of ongestructureerde gegevens. De gegevens uit verschillende bronnen worden verwerkt, getransformeerd en opgenomen in één enkele database die een datawarehouse wordt genoemd. Gebruikers hebben toegang tot deze verwerkte gegevens in het datawarehouse via verschillende tools zoals Business Intelligence-tools, SQL-clients, spreadsheets en vele andere tools. Deze gegevens helpen bij het uitvoeren van datamining-bewerkingen die helpen een patroon in de gegevens te vinden.

Als je nu op zoek bent naar een baan die gerelateerd is aan Data Warehousing, moet je je voorbereiden op de sollicitatievragen voor Data Warehousing 2019. Het is waar dat elk interview anders is volgens de verschillende functieprofielen. Hier hebben we de belangrijke sollicitatievragen en antwoorden voor Data Warehousing opgesteld die u zullen helpen succes te behalen in uw interview.

Laten we nu enkele van de belangrijke sollicitatievragen voor Datawarehousing 2019 begrijpen die in een interview kunnen worden gesteld. Maar dit betekent niet dat dit de enige vragen zijn die in een interview worden gesteld, je moet goed voorbereid zijn op elk onderwerp dat we hier bespreken. Deze vragen zijn als volgt verdeeld in twee delen:

Deel 1 - Interviewvragen datawarehousing (basis)

Dit eerste deel behandelt de basisvragen en antwoorden over datawarehousing

Q1. Wat is data warehousing?

Antwoord:
Data Warehousing is een proces waarbij gegevens uit verschillende bronnen worden verzameld en verwerkt en een enorme database wordt opgeslagen, dus de verwerkte gegevens kunnen voor verschillende doeleinden worden gebruikt, zoals analytische rapportage, business intelligence of datamining enz. Het basisidee achter het datawarehouse is niets maar het opslaan van een enorme hoeveelheid gegevens.

Q2. Verschil tussen database en datawarehouse?

Antwoord:
Hieronder vindt u de verschillende tabellen die door Data Warehousing worden ondersteund:

Database Data Warehouse
Verzameling van gegevens die worden gebruikt voor het opslaan, openen en ophalenVerzameling van gegevens die worden gebruikt voor het uitvoeren van analyses
Beperkt tot de enkele applicatieKan door meerdere applicaties worden gebruikt
Slaat genormaliseerde gegevens opGegevens hoeven niet te worden genormaliseerd, meestal opgeslagen als gedenormaliseerde gegevens
ER-gebaseerd en toepassingsgerichtsneeuwvlok of start schema-gebaseerd en onderwerp-georiënteerd
Gebruikt voor transactieverwerkingGebruikt voor gegevensmodellering en analyse

Laten we doorgaan naar de volgende interviewvragen voor Data Warehousing

Q3. Wat zijn de fasen van Data Warehousing?

Antwoord:
Algemene fasen van het datawarehouse zijn:

  • Offline operationele database: gegevens worden van het besturingssysteem naar een andere server gekopieerd om verschillende bewerkingen uit te voeren.
  • Offline Data Warehouse: gegevens in het Data Warehouse worden regelmatig bijgewerkt vanuit de operationele database.
  • Real Time Data Warehouse: Data Warehouse wordt bijgewerkt wanneer een transactie plaatsvindt in het operationele systeem.
  • Integrated Data Warehouse: Data Warehouse wordt continu bijgewerkt wanneer een transactie wordt uitgevoerd op het operationele systeem.

Q4. Wat is Business Intelligence (BI)?

Antwoord:
Dit zijn de basis Interviewvragen voor Data Warehousing die in een interview worden gesteld. BI is een technologiegestuurd proces voor het analyseren van gegevens en het presenteren van betekenisvolle inzichten aan de eindgebruikers die helpt bij het nemen van betere beslissingen. BI omvat verschillende hulpmiddelen die helpen bij het begrijpen van de gegevenstrends en patronen die in de gegevens zijn verborgen. Sommige van de tools die op grote schaal worden gebruikt, zijn SAP Business Intelligence, MicroStrategy, Science, Tableau en nog veel meer.

Q5. Wat zijn de componenten van Data Warehouse?

Antwoord:
Vier componenten van het Data Warehouse zijn:

  • Load Manager: het voert alle bewerkingen uit die zijn gekoppeld aan het extraheren en laden van gegevens in het magazijn.
  • Magazijnbeheer: het voert bewerkingen uit die zijn gekoppeld aan de gegevens in het magazijn. Het voert bewerkingen uit zoals gegevensanalyse om consistentie te waarborgen, het maken van indexen en weergaven en vele andere bewerkingen.
  • Query Manager: voert alle bewerkingen uit die betrekking hebben op gebruikersquery's. De bewerkingen van dit onderdeel zijn directe query's naar de juiste tabellen.
  • Eindgebruikerstoegangstool: hulpmiddelen die eindgebruikers gebruiken om toegang tot de gegevens te krijgen. Het is onderverdeeld in verschillende groepen zoals
  1. Data Reporting tools
  2. Query-tools
  3. Hulpmiddelen voor applicatieontwikkeling
  4. EIS-hulpmiddelen
  5. OLAP- en dataminingtools

Deel 2 - Vragen over datawarehousing-interviews (geavanceerd)

Laten we nu eens kijken naar de geavanceerde interviewvragen voor Data Warehousing.

Q6. Wat is de dimensietabel?

Antwoord:
Dimensietabel in een datawarehouse is een tabel in een sterschema. Dimensietabellen worden gebruikt om dimensie of attributen op te slaan die de gegevens in de feitentabel beschrijven. Productdimensie kan bijvoorbeeld de naam, beschrijving, eenheidsprijs, gewicht, kleur en vele andere kenmerken bevatten. Het systeem dat de sleutel genereert, wordt op unieke wijze gebruikt om de rij in de dimensietabel te identificeren. Deze sleutel fungeert als een primaire sleutel in de dimensietabel en wordt in feite als een externe sleutel gebruikt, die helpt om de twee tabellen samen te voegen.

Q7. Wat is de feitentabel?

Antwoord:
Een feitentabel is de middentabel van het sterrenschema, omgeven door een dimensietabel van een datawarehouse. Feitentabel bestaat uit de kwantitatieve statistieken of feiten van het bedrijfsproces. Feitentabel werkt met een dimensietabel en slaat de gegevens op die moeten worden geanalyseerd. De feitentabel bevat een kolom met een externe sleutel die fungeert als een primaire sleutel in de dimensietabel. Met deze sleutel kunnen deze twee tabellen worden samengevoegd.

Laten we doorgaan naar de volgende interviewvragen voor Data Warehousing

Q8. Wat is Data Mart?

Antwoord:
Data Mart is een subset van het datawarehouse die meestal een specifieke set gegevens bevat die betrekking hebben op een specifieke business line. Data Mart is klein en wordt gebruikt bij het doorzoeken of analyseren van een specifieke set gegevens, bijvoorbeeld gegevens met betrekking tot "Verkoop", "Klanten", "Bestelling" enz.

Q9. Wat is de Operational Data Store (ODS)?

Antwoord:
Dit zijn de meest gestelde sollicitatievragen voor Data Warehousing in een interview. Een ODS is het type database waarin gegevens worden opgeslagen die door operationele systemen worden gebruikt voordat ze in een datawarehouse worden opgeslagen. Het dient als de tussenliggende database. Een ODS bevat kortetermijngegevens, terwijl een datawarehouse historische gegevens bevat.

Q10. Uitleg Data Warehouse-architectuur.

Antwoord:
Het omvat de volgende fasen:

  • Gegevensbronlaag: in dit stadium worden gegevens uit verschillende bronnen verzameld en opgeslagen in een relationele database. Gegevens omvatten sociale mediagegevens, operationele gegevens, transactiegegevens en nog veel meer.
  • Data Staging-laag: in dit stadium worden gegevens uit de gegevensbronlaag geëxtraheerd en verwerkt omdat gegevens uit verschillende bronnen en met verschillende indelingen komen. De geëxtraheerde gegevens zullen worden onderworpen aan kwaliteitscontroles en eindresultaten zullen schone en georganiseerde gegevens zijn die in het gegevensmagazijn worden geladen.
  • Laag voor gegevensopslag: in deze laag worden de gegevens uit het verzamelgebied opgeslagen als een enkele centrale opslagplaats. Afhankelijk van de bedrijfsvereisten kan opslag een datawarehouse, data mart of een Operational Data Store zijn.
  • Gegevenspresentatielaag: deze laag wordt gebruikt door gebruikers om toegang te krijgen tot de gegevens. Gebruikers kunnen verschillende query's uitvoeren of analyses uitvoeren om rapporten uit te voeren.

Aanbevolen artikel

Dit is een leidraad geweest voor de lijst met interviewvragen en antwoorden over data warehousing, zodat de kandidaat deze interviewvragen voor data warehousing gemakkelijk kan beantwoorden. Hier in dit bericht hebben we de beste interviewvragen van Data Warehousing bestudeerd die vaak in interviews worden gesteld. U kunt ook de volgende artikelen bekijken voor meer informatie -

  1. Vragen en antwoorden over sollicitatiegesprekken bij RMAN
  2. Top 10 sollicitatievragen voor Data Analyst
  3. De meesten stellen interviewvragen
  4. PowerShell: sollicitatievragen
  5. Volledige gids voor Oracle Data Warehousing