Inleiding tot ETL Interviewvragen en antwoorden

ETL staat voor Extract-Transform-Load. Het is een systeembasis van Datawarehouse, waar de gegevens uit de verschillende bronnen worden geëxtraheerd en vervolgens worden de gegevens getransformeerd waar de gegevens worden afgedwongen of verwerkt om kwaliteit, consistentie van de gegevens in een geschikt presentatie-formaat en vervolgens de gegevens worden in Data Warehouse in presentatie-indeling geladen, zodat het de eindgebruiker kan helpen de informatie gemakkelijk te krijgen en een beslissing kan nemen.

Hieronder staan ​​de top ETL-interviewvragen van 2019 die vaak in een interview worden gesteld

Als je op zoek bent naar een baan die gerelateerd is aan ETL, moet je je voorbereiden op de ETL-interviewvragen van 2019. Hoewel elk interview anders is en de reikwijdte van een baan ook anders, kunnen we u helpen met de beste ETL-interviewvragen en -antwoorden, die u zullen helpen de sprong te wagen en uw succes in uw interview te krijgen.

Deel 1 - ETL-interviewvragen (basis)

Dit eerste deel behandelt basis ETL-interviewvragen en -antwoorden

1. Het ETL-systeem uitbreiden in het datawarehouse? Leg uit

Antwoord:
Het ETL-systeem (Extract-Transform-Load) vormt de basis van het datawarehouse. Een goed ontworpen ETL-systeem extraheert gegevens uit de bronsystemen, handhaaft gegevenskwaliteits- en consistentie-normen, bevestigt gegevens zodat afzonderlijke bronnen samen kunnen worden gebruikt, en levert uiteindelijk gegevens in een presentatie-klaar formaat zodat toepassingsontwikkelaars toepassingen en eindgebruikers kunnen bouwen kan beslissingen nemen.

2. De betekenis van het ETL-systeem in het datawarehouse?

Antwoord :
Verwijdert fouten en corrigeert ontbrekende gegevens. Het biedt gedocumenteerde metingen van vertrouwen in gegevens. Legt de stroom van transnationale gegevens vast voor bewaring. Past gegevens uit meerdere bronnen aan om samen te gebruiken. Structureert gegevens zodat ze kunnen worden gebruikt door eindgebruikerstools.

3. Wat is het dagelijkse proces in het ETL-systeem?

Antwoord :
Bouw de ontwikkeling / test / productie suite van ETL-processen. Begrijp de afwegingen van verschillende back-room datastructuren, waaronder platte bestanden, genormaliseerde schema's, XML-schema's en star-join (dimensionale) schema's. Brongegevens analyseren en extraheren. Bouw een uitgebreid subsysteem voor het opschonen van gegevens. Structureer gegevens in dimensionale schema's voor de meest effectieve levering aan eindgebruikers, business intelligence-tools, data-mining-tools, OLAP-kubussen en analytische applicaties. Lever effectief gegevens aan zowel sterk gecentraliseerde als diep gedistribueerde datawarehouses met dezelfde technieken. Stem het algemene ETL-proces af voor optimale prestaties.

Laten we doorgaan naar de volgende ETL-interviewvragen.

4. Gegevensformaten in het ETL-systeem?

Antwoord :
Er is een verschillende gegevensindeling in ETL, sommige zijn platte bestanden, XML-gegevenssets, onafhankelijke DBMS-werktafels, genormaliseerde entiteit / relatie (E / R) -schema's en dimensionale gegevensmodellen.

5. Gegevensprofilering in ETL-systeem?

Antwoord :
Gegevensprofilering is een systematisch onderzoek van de kwaliteit, reikwijdte en context van een gegevensbron om een ​​ETL-systeem te kunnen bouwen. In het uiterste geval vereist een zeer schone gegevensbron die goed is onderhouden voordat deze in het gegevensmagazijn arriveert, minimale transformatie en menselijke tussenkomst nodig heeft om rechtstreeks in de uiteindelijke dimensietabellen en feitentabellen te worden geladen.

6. Wat is een ETL-validator?

Antwoord :
ETL Validator is een datatesttool die het testen van data-integratie-, datawarehouse- en datamigratieprojecten aanzienlijk vereenvoudigt. Het maakt gebruik van onze gepatenteerde ELV-architectuur om gegevens te extraheren, laden en valideren uit gegevensbronnen zoals databases, platte bestanden, XML-, Hadoop- en BI-systemen.

Deel 2 - ETL-interviewvragen (geavanceerd)

Laten we nu eens kijken naar de geavanceerde ETL-interviewvragen.

7. Wat zijn de bewerkingen in het ETL-systeem?

Antwoord :
De volgende drie bewerkingen: extraheert de gegevens uit uw transnationale systeem dat een Oracle, Microsoft of een andere relationele database kan zijn, transformeert de gegevens door gegevensopruimingsbewerkingen uit te voeren. Een belasting is een proces waarbij de gegevens in de doeldatabase worden geschreven.

8. Noem enkele ETL-tools die het meest op de markt worden gebruikt?

Antwoord:
Er zijn verschillende ETL-tools op de markt, maar sommige van de vochtige voorkeur ETL Tools
• Oracle Warehouse Builder (OWB)
• SAP Data Services.
• IBM Infosphere Information Server.
• SAS-gegevensbeheer.
• Power Center Informatica.
• Elixir Repertoire voor Data ETL.
• Data Migrator (IBI)
• SQL Server Integration Services (SSIS)

9. Wat zijn de rollen en verantwoordelijkheden van het ETL-team?

Antwoord:
De rollen van het ETL-team op het hoogste niveau zijn het bouwen van de achterkamer van het datawarehouse.
• Lever gegevens het meest effectief aan eindgebruikerstools
• Voeg waarde toe aan gegevens in de reinigings- en conformerende stappen
• Bescherm en documenteer de gegevenslijn
• Extraheren van gegevens uit de originele bronnen
• Kwaliteitsborging en opschoning van gegevens
• Voldoen aan de labels en maatregelen in de te bereiken gegevens
• consistentie tussen de oorspronkelijke bronnen
• Gegevens leveren in een fysiek formaat dat kan worden gebruikt door queryhulpprogramma's,
• Rapportschrijvers en dashboards.

Laten we doorgaan naar de volgende ETL-interviewvragen.

10. Wat is de rol van impactanalyse in het ETL-systeem?

Antwoord:
Impactanalyse onderzoekt de metagegevens die zijn gekoppeld aan een object (in dit geval een tabel of kolom) en bepaalt wat wordt beïnvloed door een wijziging in de structuur of inhoud ervan. Het wijzigen van data-staging-objecten kan processen verbreken die cruciaal zijn voor het correct laden van het datawarehouse. Het toestaan ​​van ad-hocwijzigingen in data-staging-objecten is nadelig voor het succes van uw project. Nadat een tabel is gemaakt in het verzamelgebied, moet u een impactanalyse uitvoeren voordat u wijzigingen aanbrengt. Veel leveranciers van ETL-tools bieden functionaliteit voor impactanalyse, maar deze functionaliteit wordt vaak over het hoofd gezien tijdens de proof-of-concept van het ETL-product omdat het een backroomfunctie is en
Niet echt belangrijk totdat het datawarehouse operationeel is en begint te evolueren.

11. Hoe verwerk je het platte bestand met vaste lengte?

Antwoord:
Een bestandsindeling met een vaste lengte moet de bestandsnaam bevatten, waar het veld begint; zijn lengte; en het gegevenstype (meestal tekst of nummer). Soms wordt de eindpositie opgegeven. Als dit niet het geval is, moet u de eindpositie van elk veld berekenen op basis van de beginpositie en lengte als dit vereist is voor uw ETL-tool. In de meeste ETL-tools moet u waarschijnlijk de bestandslay-out van het platte bestand één keer handmatig invoeren. Nadat de lay-out is ingevoerd, onthoudt de tool de lay-out en verwacht deze dezelfde lay-out telkens wanneer deze in wisselwerking staat met het werkelijke platte bestand. Als de bestandsindeling verandert of de gegevens van de toegewezen posities worden verplaatst, moet het ETL-proces worden geprogrammeerd om te mislukken. Wanneer u platte bestanden met een vaste lengte verwerkt, probeer dan te valideren dat de posities van de gegevens in het bestand nauwkeurig zijn. Een snelle controle om de posities te valideren is om elk datum- (of tijd) veld te testen om te controleren of het een geldige datum is. Als de posities worden verschoven, bevat het datumveld hoogstwaarschijnlijk alfanumerieke tekens of onlogische cijfers. Andere velden met zeer specifieke domeinen kunnen op dezelfde manier worden getest. XML biedt meer concrete validatiemogelijkheden. Als gegevensvalidatie of consistentie een probleem is, probeert u de gegevensprovider te overtuigen om de gegevens in XML-indeling te leveren.

12.Waarom realtime ETL in datawarehouse?

Antwoord:
Datawarehouse moest zakelijke besluitvormers een niet-aflatende set gegevens bieden, waardoor een betrouwbare informatielaag kon worden geboden. Voor actuele rapportages tegen een twinkelende database werden zakelijke gebruikers doorverwezen naar de productietoepassingen die het bedrijf runnen. Daarom moesten gebruikers naar het datawarehouse voor een historisch beeld van wat er gisteren in het bedrijf gebeurde en moesten ze in veel OLTP-systemen kijken voor een beeld van wat er vandaag gebeurde. Zakelijke gebruikers hebben deze kloof nooit volledig geaccepteerd. Datawarehouses hebben natuurlijk absoluut constante klantinformatiestromen nodig vanuit een operatie, maar steeds meer operationele systemen vertrouwen ook op datawarehouse-verrijking van klantinformatie. Daarom is het voorspelbaar dat organisaties architecturale alternatieven zijn gaan verkennen die meer algemene integratiescenario's kunnen ondersteunen om operationele gegevens tussen applicaties en tegelijkertijd in en uit het magazijn met steeds toenemende urgentie te verplaatsen.

Aanbevolen artikelen

Dit is een gids voor Lijst met ETL-interviewvragen en -antwoorden, zodat de kandidaat deze ETL-interviewvragen gemakkelijk kan beantwoorden. U kunt ook de volgende artikelen bekijken voor meer informatie -

  1. Azure Paas vs Iaas - Kenmerken
  2. 9 Verbazingwekkende MapReduce-interviewvragen en -antwoorden
  3. Top 11 meest nuttige RDBMS Interviewvragen en antwoorden
  4. 10 meest geweldige PHP-interviewvragen voor ervaren
  5. Ken de Top 5 Handige DBA-interviewvragen en antwoorden

Categorie: