Inleiding tot Pig-interview Vraag en antwoorden

Apache Pig is een platform op hoog niveau dat wordt gebruikt om programma's te maken die op de Hadoop worden uitgevoerd. The Language of Pig staat bekend als Pig Latin. Pig is geschreven in Java en is ontwikkeld door Yahoo Research en Apache Software Foundation. De eerste release vond plaats op 11 september 2008. Voorbereiding op een sollicitatiegesprek bij Pig. Ik weet zeker dat je de meest voorkomende vragen en antwoorden over Pig Interview wilt weten waarmee je het Pig Interview gemakkelijk kunt kraken.

Hieronder is de lijst met de beste Pig-interviewvragen en antwoorden tot uw redding. deze interviewvragen zijn als volgt verdeeld in twee delen:

  • Deel 1 - Interviewvragen over varkens (basis)
  • Deel 2 - Interviewvragen over varkens (geavanceerd)

Deel 1 - Interviewvragen over varkens (basis)

Dit eerste deel behandelt fundamentele vragen en antwoorden over het interview met Pig

Vraag 1. Wat is het verschil tussen Map verkleinen en Pig?

Antwoord:
Map Reduce is een gecompileerde taal en de code-efficiëntie van Map-reduce is hoog en Pig is een scripttaal met minder code-efficiëntie.

Vraag 2. Wat bedoel je met de zak in Varken?

Antwoord:
Het verzamelen van tupels staat bekend als een zak in een varken.

Q3.Wat zijn de complexe gegevenstypen in Pig?

Antwoord:
Map, Tuples en Bag zijn de complexe gegevenstypen van Pig.

Q4.Wat is plat in Varken?

Antwoord:
Als we het nestelen uit de gegevens in tuple of tas willen verwijderen, gebruiken we Flatten.

Q5 Stel dat we een bestandsnaam hebben met abc.csv en het kenmerk hebben zoals id, naam, jaar, beoordeling, duur. Hoe upload je dit bestand naar een varken?

Antwoord:
films = LOAD 'pad van abc.csv' MET Varkensopslag (', ') als (id, naam, jaar, beoordeling, duur);

Q6.Wat is het verschil tussen PigLatin en HIVEQL?

Antwoord:
HIVEQL is een declaratieve taal en PigLatin is een proceduremail.

Laten we doorgaan naar de volgende Pig Interview-vragen.

Vraag 7: Wat bedoel je met een binnenzak en een buitenzak in varken?

Antwoord:
De relatie in de tas wordt de binnenzak genoemd en de normale relatie staat bekend als een buitenzak.

Q8.Wat is het verschil tussen Groep en COGROUP?

Antwoord:
GROUP-operator is gewend om de gegevens in een enkele relatie te groeperen en COGROUP wordt gebruikt om de relatie in GROUP en JOIN te maken.

Q9.Wat is het verschil tussen COUNT en COUNT_STAR?

Antwoord:
De functie COUNT werkt niet met een NULL-waarde wanneer we een element in een zak tellen, maar COUNT_STAR zal de waarde NULL overwegen.

Q10. Welke diagnostische operatoren zijn beschikbaar in Apache Pig?

Antwoord:
Dump operator, operator beschrijven, operator uitleggen, operator illustreren.

Q11.Wat bedoel je met de operator UNION en SPLIT?

Antwoord:
Door een UNION-operator te gebruiken, kunnen we de inhoud van twee of meer relaties samenvoegen en een SPILLED-operator wordt gebruikt om de enkele relatie in twee of meer relaties te verdelen.

Q12.Hoe krijg je de top 10 tupels uit de relatie R?

Antwoord:
Door de functie TOP () te gebruiken.

Laten we doorgaan naar de volgende Pig Interview-vragen.

Vraag 13: Wat zijn de overeenkomsten tussen Pig en Hive?

Antwoord:
Pig gebruikt PigLatin en Hive gebruikt HiveQL, beide converteren de opdrachten naar MapReduce-taken.

Q14.Wat zijn de verschillende typen UDF-functies van JAVA die worden ondersteund door Apache Pig?

Antwoord:
Algebraïsche, Eval- en filterfuncties zijn de typen UDF-functies.

Q15.U hebt een bestand films.txt in de HDFS-map met 1000 records. U wilt alleen de eerste 10 records van het bestand films.txt zien. Hoe gaat u dit doen?

Antwoord:
Eerst moet u de films.txt laden met de relatienaam film:
films = LOAD 'pad van films.txt' GEBRUIK Varkensopslag (', ') als (attributen);
Resultaat = beperking medewerker 10

Deel 2 - Interviewvragen over varkens (geavanceerd)

Laten we nu eens kijken naar de geavanceerde sollicitatievragen voor varkens.

Q16.Hoe werken gebruikers samen met Hadoop in Pig?

Antwoord:
Door gruntshell te gebruiken

Vraag 17: ondersteunt Pig opdrachten met meerdere regels?

Antwoord:
Ja

Q18.Wat zijn alle statistiekenklassen in een varkensstallenpakket?

Antwoord:
PigStats, JobStats, OutputStats, InputStats.

Q19.Wat is UDF?

Antwoord:
De functie die niet in de operator is ingebouwd maar programmatisch een functie kan creëren om de functionaliteit naar voren te brengen.

Q20. Verklaart de hoofdlettergevoeligheid in Pig Latin?

Antwoord:
De functies en namen van relaties zijn hoofdlettergevoelig in Pig Latin, maar een naam of trefwoord en parameter zijn niet hoofdlettergevoelig.

Q21.Wat is Grunt in Pig?

Antwoord:
Grunt is een opdrachtterminal, een interactieve shell waarin we het commando van Pig geven.

Q22.Wat is de vereiste van MapReduce bij het programmeren van varkens?

Antwoord:
MapReduce is een uitvoeringsmotor.

Laten we doorgaan naar de volgende Pig Interview-vragen.

Q23.Wat is Pig Engine?

Antwoord:
Pig engine biedt de uitvoeringsomgeving voor het uitvoeren van de pig-programma's. Het zet de varkensoperaties om in MapReduce-taken.

Q24.Wat zijn de uitvoeringsmodi van Pig?

Antwoord:
Lokale modus: Varkensbewerking wordt uitgevoerd in één JVM.
MapReduce-modus: uitvoering van het Hadoop-cluster.

Q25.Wat zijn de verschillende Eval-functies beschikbaar in Pig?

Antwoord:
AVG, CONCAT, MAX, MIN, SM, SIZE, COUNT zijn verschillende EVAL-varkensfuncties.

Q26.Wat bedoel je met LOAD en STORE in Pig?

Antwoord:
Dit zijn de operator voor het laden en opslaan van de gegevens in hdf's.

Laten we doorgaan naar de volgende Pig Interview-vragen.

Q27.Welke wiskundige functie beschikbaar in Pig?

Antwoord:
ABS, ACOS, LOG, ROND, CBRT, SORT zijn de wiskundige functies die beschikbaar zijn in Pig.

V28.Wat deed het afzonderlijke trefwoord in Pig?

Antwoord:
Verschillende zoekwoorden verwijderen de dubbele zoekwoorden uit de records. Voor bijvoorbeeld:
films = LOAD 'pad van abc.csv' MET Varkensopslag (', ') als (id, naam, jaar, beoordeling, duur);
New_movies = distinct (id, naam, jaar, beoordeling, duur);

Q29.Wat bedoel je met primitief gegevenstype in varken?

Antwoord:
Int, Long, Float, Double, Char array, Byte array zijn de primitieve gegevenstypen in Pig.

Vraag 30: Wat bedoel je met een tupel in varken?

Antwoord:
Een geordende reeks velden met gegevens wordt Tuple genoemd.

Conclusie

Als je je op de Hadoop-gerelateerde taken voorbereidt, moet je het Varken daarop voorbereiden, omdat dit onderwerp de belangrijkste rol zal spelen om goede opmerkingen in het interview te krijgen. De Pig Interview-vragen die hierboven worden gedeeld, zullen je helpen om de basis en theoretisch van het Pig voor te bereiden, maar je moet het varken in handen hebben. Het zal u helpen om het vertrouwen en geavanceerde kennis op te bouwen.

Aanbevolen artikel

Dit is een leidraad geweest voor de lijst met vragen en antwoorden over varkensinterviews, zodat de kandidaat deze vragen over varkensinterviews gemakkelijk kan beantwoorden. Hier hebben we zowel de basis- als de geavanceerde sollicitatievragen voor varkens behandeld. U kunt ook de volgende artikelen bekijken voor meer informatie -

  1. Nuttige sollicitatievragen voor Apache PIG
  2. C ++ Interview Vragen
  3. Spark Interviewvragen die u moet weten
  4. Sollicitatievragen voor Komkommer