Ab initio Interview Vragen en antwoorden

Dus je hebt eindelijk je droombaan gevonden in Ab initio, maar je vraagt ​​je af hoe je het Ab initio Interview kunt kraken en wat de mogelijke Ab initio Interviewvragen voor 2018 kunnen zijn. Elk interview is anders en de reikwijdte van een baan is ook anders. Met dit in gedachten hebben we de meest voorkomende Ab initio-interviewvragen en -antwoorden voor 2018 ontworpen om u te helpen succes te behalen in uw interview.

Hieronder vindt u de top Ab Initio-interviewvragen die vaak in een interview worden gesteld. Deze interviewvragen zijn als volgt verdeeld in twee delen:

Deel 1 - Interviewvragen Ab initio (basis)

Dit eerste deel behandelt de standaard Ab initio-interviewvragen en -antwoorden.

1. Welke componenten of functies zijn beschikbaar in ab initio?

Antwoord:
De belangrijkste componenten in ab initio staan ​​hieronder,

bestanddeelDoel
dedupOm duplicaten te verwijderen
toetredenOm meerdere invoergegevensset samen te voegen op basis van een gemeenschappelijke sleutelwaarde.
SoortDit component herordent de gegevens. Het neemt de sorteervolgorde en dumpt gegevens naar het geheugen
FilterElke voorwaardelijke gerelateerde verwijdering van gegevens.
replicerenDit onderdeel is voornamelijk bedoeld voor het parallellisme, omdat een extra kopie van gegevens nuttig is terwijl andere knooppunten niet beschikbaar zijn.
samenvoegenDeze component moet meerdere invoergegevens combineren.

2. Wat zijn de soorten parallelle verwerking?

Antwoord:
Dit zijn de algemene Ab initio Interview-vragen die in een interview worden gesteld. Verschillende soorten parallelle verwerking zijn,

  1. Componentenparallellisme
  2. Gegevensparallellisme
  3. Pijpleidingsparallellisme

Componentparallellisme: een toepassing die meerdere componenten tegelijkertijd op het systeem uitvoert. Maar de gegevens zijn gescheiden. Dit wordt bereikt door parallelle verwerking op componentniveau.

Gegevensparallellisme: gegevens worden opgesplitst in segmenten en voeren de bewerkingen tegelijkertijd uit. Dit soort proces wordt bereikt met behulp van de gegevensparallelliteit

Pijplijnparallellisme: een applicatie met meerdere componenten die op dezelfde dataset draait. Dit maakt gebruik van pijplijnparallellisme.

3. Wat is de andere manier om de partities te bereiken?

Antwoord:
Er zijn meerdere manieren om de partities te maken.

WandenBeschrijving
UitdrukkingGegevens splitsen volgens de taal voor gegevensmanipulatie.
SleutelGegevens groeperen met specifieke sleutels
LaadbalansDynamische taakverdeling
PercentageScheid de gegevens waar de output grootte is op de fracties van 100
reeksVerdeel de gegevens gelijkmatig op basis van een sleutel en een bereik tussen de knooppunten
Ronde roodborstjeDe gegevens gelijkmatig in blokken verdelen over de uitvoerpartities.

Laten we doorgaan naar de volgende Ab initio-interview Vragen.

4. Wat is een multifile-systeem?

Antwoord:
Multifile is een set mappen op verschillende knooppunten in een cluster. Ze hebben een identieke mapstructuur. Het multifile-systeem leidt tot betere prestaties omdat het een parallelle verwerking is waarbij de gegevens zich op meerdere schijven bevinden.

Het wordt gemaakt met de besturingspartitie op het ene knooppunt en gegevenspartities op het andere knooppunt om de verwerking te distribueren om de prestaties te verbeteren.

5. Verschil tussen Hadoop en Ab initio?

Antwoord:

HadoopAb initio
Open sourceEigen software
Parallelle verwerking via kaartenmakers en verloopstukkenParallelle verwerkingsarchitectuur
Elke verscheidenheid aan gegevens is hier het meest geschiktHet beste voor traditionele EDW-implementaties
Fouttolerantie is bereiktFouttolerantie wordt niet bereikt
MapReduce wordt bestuurd op alle componenten of functiesComponenten zoals toetreden, groeperen, sorteren zijn eenvoudig

uitgevoerd

Goedkoop als open source en kan alle zakelijke gebruikstoepassingen uitproberen.Duur en van toepassing op een hoogwaardige business case vanwege de kosten
Losjes gekoppelde componenten waar aangepaste functies worden gebouwdNauw gekoppeld tussen de componenten, omdat ze sterk worden aanbevolen op basis van de business use case.

Deel 2 - Interviewvragen Ab initio (geavanceerd)

Laten we nu eens kijken naar de geavanceerde Ab initio-interviewvragen.

6. Wat voor soort lay-outs ondersteunt Ab initio?

Antwoord:

  • Ondersteunt seriële en parallelle lay-outs.
  • Een grafische lay-out ondersteunt zowel seriële als parallelle lay-outs tegelijk.
  • Een multi-bestandssysteem is een 4-weg parallel systeem
  • Een component in een grafieksysteem kan een 4-weg parallel systeem uitvoeren.

7. Wat is de relatie tussen Enterprise metadata environment (EME), de Graphical development environment (GDE) en het samenwerkende systeem?

Antwoord:
CoOperating System: het werkt bovenop het besturingssysteem en dit wordt geleverd door de ab initio en het is de basis voor alle Ab Initio-processen. Air-opdrachten zijn een van de functies die op verschillende besturingssystemen kunnen worden geïnstalleerd, zoals UNIX, Linux, IBM enz

Dit zijn de volgende functies die het biedt,
- Beheert en voert Ab Initio-grafieken uit en beheert de ETL-processen
- Het verstrekken van de extensies
- ETL verwerkt monitoring en debuggen
- Beheer van metagegevens en interactie met de EME

GDE: Het is een ontwerpcomponent en wordt gebruikt om de ab initio-grafieken uit te voeren.

Grafieken worden gevormd door de componenten (vooraf gedefinieerd of door de gebruiker gedefinieerd) en stromen en de parameters. Het biedt het ETL-proces in Ab Initio dat wordt weergegeven door grafieken.

Mogelijkheid om uit te voeren, fouten in de proceslogboeken op te sporen en uitvoeringslogboeken te traceren

Enterprise Meta-Environment (EME): het is een omgeving voor opslag en ook metadatabeheer (zowel zakelijke als technische metadata). De metagegevens zijn toegankelijk via de grafische ontwikkelomgeving en ook via de webbrowser of de samenwerkende opdrachtregel. Het is ab initio repository voor tijdelijke aanduidingen.

Laten we doorgaan naar de volgende Ab initio-interviewvragen.

8. Hoe gegevens worden verwerkt en wat zijn de fundamenten van deze aanpak?

Antwoord:
Er zijn bepaalde activiteiten die het verzamelen van de gegevens vereisen en de beste verwerking is in veel gevallen grotendeels van hetzelfde afhankelijk. Voordat de gegevens worden verwerkt, moet deze zich op een tijdelijke aanduiding bevinden, zoals een goed gedefinieerde opslag. Deze taak hangt af van enkele belangrijke factoren die ze zijn

1. Verzameling van gegevens
2. Presentatie
3. Eindresultaten
4.Analysis
5.Sorting

9. Wat is het verschil tussen partitionering met sleutel en round robin?

Antwoord :
Dit zijn de geavanceerde Ab initio-interviewvragen die in een interview werden gesteld. Partitie door sleutel
Hierin moeten we de sleutel specificeren op basis waarvan de partitie zal optreden. Het resulteert in uitgebalanceerde gegevens dankzij de op sleutel gebaseerde partities. Het is handig voor sleutelafhankelijke
parallellisme.
Partitie door round robin: hierbij worden de gegevens gelijkmatig verdeeld in blokken van blokgrootte en worden de records op een opeenvolgende manier verdeeld over de uitvoerpartitie. Het is niet de sleutel
gebaseerd en resultaten zijn uitgebalanceerde gegevens, vooral met een blokgrootte van 1. Het is nuttig voor
record onafhankelijk parallellisme.

10. Hoe verbeter je de prestaties van een grafiek?

Antwoord :
Er zijn veel manieren waarop de prestaties van de grafiek kunnen worden verbeterd.
1) Verminder het gebruik van meerdere componenten in bepaalde fasen.
2) Gebruik een verfijnde en goed gedefinieerde waarde van max. Kernwaarden voor het sorteren en samenvoegen van componenten
3) Minimaliseer het gebruik van reguliere expressiefuncties zoals re_index in de overdrachtsfuncties
4) Minimaliseer de gesorteerde join-component en vervang ze indien mogelijk door een join / hash-join in het geheugen
5) Gebruik alleen verplichte velden bij het sorteren, opnieuw formatteren, samenvoegen van componenten
6) Gebruik van fase of de stroombuffering tijdens het samenvoegen of gesorteerde joins
7) Gebruik hash-join als de twee sets invoer klein zijn, anders is het beter om de gesorteerde join te kiezen voor de enorme invoer-grootte
8) Gebruik voor grote datasets beter geen uitzending als gepartitioneerd
9) Verminder het aantal sorteercomponenten tijdens de verwerking.
10) Vermijd herverdeling van gegevens onnodig

Aanbevolen artikel

Dit is een handleiding voor de lijst met Ab initio-interviewvragen en -antwoorden, zodat de kandidaat deze Ab initio-interviewvragen gemakkelijk kan beantwoorden. Hier in dit bericht hebben we de beste Ab initio-interviewvragen bestudeerd die vaak in interviews worden gesteld. U kunt ook de volgende artikelen bekijken voor meer informatie -

  1. Interviewvragen voor Android - Top 10 nuttige vraag
  2. Statistiek Interview Vragen | Handig en meest gevraagd
  3. Minitab: sollicitatievragen - Top 7 nuttige vragen om te leren
  4. Gesplitste sollicitatievragen en antwoorden die u moet weten