Inleiding tot Hadoop-planners

Als we het over Hadoop hebben, is het eerste wat ons opvalt de big data. Maar hebben we ons ooit afgevraagd dat Hadoop op zichzelf niet alleen een technologie is, maar in plaats daarvan veel tools en technieken bevat, dus hoe kunnen we precies bereiken wat automatisch door Hadoop is bedoeld. Het antwoord op deze vraag is door gebruik te maken van Hadoop-planners.

Het maakt een hoge verwerkingsgraad van het systeem mogelijk en staat ook bekend als het algemene systeem dat werkt op het distributieniveau van een set gegevens en informatie. Het is een multitasking-systeem dat wordt gebruikt om meerdere gegevenssets voor veel gebruikers en taken tegelijkertijd te verwerken. Eerder werd slechts één planner gebruikt voor alle taken, maar nu zijn Hadoop-planners die worden gebruikt in combinatie met JobTracker-logica en worden ook ondersteund door Hadoop.

Top 4 Hadoop-planningssoorten

Er zijn verschillende soorten Hadoop-planners die we vaak gebruiken:

1. Hadoop First in First out Scheduler

  • Zoals de naam al doet vermoeden, is dit een van die oudste taakplanners die werkt volgens het principe van first in en first out. Kortom, als we het hebben over het proces zoals dat van JobTracker, hebben we het over het uit de wachtrij halen van taken waarvan vaak wordt gezegd dat het de werkwachtrij is.
  • Volgens die werkwachtrij zal de taak die de oudste is, di degene die de eerste is geweest, ook de eerste zijn die wordt uitgevoerd.
  • Men geloofde altijd dat dit een veel eenvoudiger aanpak was dan andere planningstechnieken en daarom werd niet veel nagedacht over het schrapen van deze techniek alleen om nieuwere benaderingen met betere planningmogelijkheden te vinden, omdat ze ook concepten van grootte en prioriteit van de taak in zich hadden.

2. Hadoop Capaciteitsplanner

  • De Hadoop Capaciteitsplanner lijkt min of meer op de FIFO-benadering, behalve dat deze ook gebruik maakt van het prioriteren van de taak. Deze heeft een iets andere aanpak als we het hebben over het planningsniveau voor meerdere gebruikers.
  • Het is bekend dat deze een afzonderlijke MapReduce-cluster plant en simuleert voor elke organisatie of de gebruiker en dat gebeurt samen met het FIFO-type schema.

3. Hadoop Fair Type Scheduler

  • Als er behoefte is aan een afzonderlijke en redelijke hoeveelheid clustercapaciteit met tijd en periode, maken we gebruik van de Hadoop-beursplanner. Het is nuttig om alle clusters te krijgen, zelfs als een bepaalde taak actief is.
  • Bovendien worden alle vrije slots van het cluster aan alle taken aangeboden op een manier zodat elke gebruiker een genormaliseerd aandeel van het deel van zijn cluster krijgt naarmate meer taken nuttig worden om te worden ingediend.
  • Als er een pool is die nog geen redelijk deel en een genormaliseerd aandeel heeft ontvangen voor een redelijk goede hoeveelheid tijd en periode, dan komt voorrang in het spel waardoor alle gepoolde taken worden gedood en de capaciteit om die pool te leveren wordt uitgevoerd slots om onder capaciteit te draaien.
  • Bovendien wordt dit ook wel de contrib-module genoemd, wat betekent dat door deze controletechniek van Hadoop te kopiëren naar de op lib gebaseerde directory en het JAR-bestand op de juiste locatie te plaatsen deze planningstechniek kan worden ingeschakeld. Het enige dat moet worden gedaan, is het instellen van de eigenschap van de taakplanner op mapred.FairScheduler.

4. Andere benaderingen met betrekking tot de planner

  • Hadoop zorgt ervoor dat een voorziening wordt geboden voor het aanbieden van virtuele clusters, wat betekent dat de behoefte aan fysieke werkelijke clusters kan worden geminimaliseerd en deze techniek staat bekend als HOD (Hadoop on Demand).
  • Het maakt gebruik van op Torque gebaseerde resource manager om de knooppunten op peil te houden en de toewijzing ervan aan de behoefte van de virtuele cluster.
  • Het wordt gebruikt om de belasting en het systeem te initialiseren dat is gebaseerd op de specifieke knooppunten in het virtuele en niet op het fysieke cluster en ook samen met de toegewezen knooppunten, alleen nadat de configuratiebestanden automatisch zijn voorbereid.
  • Het HOD-cluster kan ook op relatief veel onafhankelijke wijze worden gebruikt nadat de initialisatie heeft plaatsgevonden. Kortom, een notedopmodel dat wordt gebruikt voor de implementatie van deze grote Hadoop-clusters bevindt zich in de cloudinfrastructuur en dat is wat de HOD wordt genoemd. Het deelt relatief minder knooppunten en biedt daarom een ​​grotere hoeveelheid beveiliging.

Het belang van het gebruik van Hadoop-planners

  1. Uit de typen Hadoop-planners moet duidelijk zijn waar het belang van het gebruik van deze Hadoop-planners ligt. Als u een groot cluster met verschillende opdrachttypen, verschillende prioriteiten en groottes samen met meerdere clients beheert, kiest u de juiste soort Hadoop-planner om belangrijk te worden.
  2. Dit is belangrijk omdat het zorgt voor gegarandeerde toegang tot het ongebruikte capaciteitsniveau en een optimaal gebruik van middelen door de taken efficiënt binnen de wachtrijen te prioriteren. Hoewel dit deel van de Hadoop-planners relatief eenvoudig is, is het gebruik van eerlijke planners meestal de juiste keuze als er een verschil is tussen het aantal en de soorten clusters die binnen één organisatie worden uitgevoerd.
  3. Deze eerlijke planner kan nog steeds worden gebruikt om poolcapaciteit van taken te verstrekken en niet uniform te verdelen en het wordt op een veel eenvoudiger en configureerbare manier gedaan. De eerlijke planner komt ons ook te hulp als we praten over de aanwezigheid van gediversifieerde soorten banen, omdat deze kunnen worden gebruikt om hogere responstijden te bieden voor relatief kleinere taken die worden gemengd met de grotere soorten taken en de ondersteuning hiervoor is opgenomen in het interactieve gebruik van modellen.
  4. Capaciteitsplanners zijn nuttig, wanneer u zich meer zorgen maakt over de wachtrijen in plaats van het niveau van gemaakte pools en ook het configureerbare niveau van de kaart en het verminderen van taken van het type slots zijn beschikbaar en de wachtrij zich een gegarandeerde capaciteit van het cluster kan veroorloven.

Conclusie

In dit bericht lezen we over de Hadoop-planners, hun betekenis, introductie, soorten Hadoop-planners, hun functies en leerden we ook over het belang van deze Hadoop-planners. Als het gaat om het big data-ecosysteem en de omgeving, zijn Hadoop-planners iets waarover vaak niet wordt gesproken, maar van het grootste belang is en niet kan worden veroorloofd om te blijven zoals het is. Ik hoop dat je ons artikel leuk vond.

Aanbevolen artikelen

Dit is een handleiding voor Hadoop-planners. Hier bespreken we de introductie en de top 4 soorten Hadoop-planners met het belang van het gebruik ervan. U kunt ook de volgende artikelen bekijken voor meer informatie-

  1. Swing componenten in Java
  2. JTabbedPane in Java
  3. Beschermd trefwoord in Java
  4. JTextArea in Java

Categorie: