Inleiding tot de lijst met R-pakketten

Een pakket in R-programmeertaal is een eenheid die vereiste functionaliteiten biedt die kunnen worden gebruikt door het in de R-omgeving te laden. Een lijst met R-pakketten is vergelijkbaar met een bibliotheek in C, C ++ of Java. Dus in wezen kan een pakket tal van functionaliteiten hebben, zoals functies, constanten, enz. Die we de gebruiker zullen toestaan ​​om ze te gebruiken in de context van een bepaald probleem. In R kan een vereist pakket worden geladen met de functie library (). Als een pakket niet aanwezig is, kan het worden geïnstalleerd met de functie install.packages (). Pakketten maken schijnbaar moeilijke taken eenvoudig door de kant-en-klare functionaliteiten.

Wat zijn R-pakketten?

Er zijn veel pakketten in R, en de selectie van een pakket is afhankelijk van de toepassing. Hoewel er bepaalde pakketten zijn die veel worden gebruikt vanwege de functionaliteiten die ze bieden, is het niet zo dat andere pakketten minder belangrijk zijn. Verschillende pakketten hebben verschillende doeleinden; sommige zijn gerelateerd aan statistische technieken, sommige hebben betrekking op visualisaties, etc.

In de volgende sectie zullen we enkele van de belangrijke pakketten in R bekijken:

1. Auto

Dit pakket is Companion to Applied Regression. Het is een groot pakket met verschillende functionaliteiten voor statistische analyse. Het importeren van dit pakket in de R-omgeving importeert andere gerelateerde pakketten zoals MASS, statistieken, grafische afbeeldingen, enz. Sommige functies in het pakket omvatten Anova, avPlots, Boxplot, carPalette, dichtheidsplots, infIndexPlot, lineaire hypothese, logit, uitbijtertest, qqPlot, restplots, scatterplot, scatterplot matrix, etc. De uitgebreide mogelijkheden van het pakket kunnen worden afgemeten aan het aantal functies dat het biedt.

2. Corrplot

Het pakket biedt een grafische weergave van een correlatiematrix en een betrouwbaarheidsinterval. Het pakket biedt ook algoritmen om matrix opnieuw te ordenen. Talrijke opties omvatten het kiezen van de vereiste kleuren, tekstlabels, kleurlabels, lay-out, enz. Verschillende visualisatiemethoden of parametermethoden in corrplot-pakket zijn "cirkel", "vierkant", "ellips", "nummer", "schaduw", "kleur" en "taart". De corrplot-functie met verschillende opties geeft een visueel aantrekkelijke weergave van de correlatie tussen verschillende variabelen, die anders onder normale omstandigheden, zoals getallen, moeilijk te interpreteren zijn. Positieve correlaties worden in blauw weergegeven en negatieve correlaties in rood. De intensiteit van kleur en de grootte van de cirkel zijn evenredig met de correlatiecoëfficiënten.

3. DataExplorer

Dit pakket gaat over geautomatiseerde gegevensverkenning en -verwerking. Het biedt een geautomatiseerd gegevensverkenningsproces dat is bedoeld voor analytische taken en voorspellende modellen. Dit is cruciaal omdat het de gebruiker in staat stelt gegevens te begrijpen en inzichten te verkrijgen. Elke variabele in de analyse wordt gescand en geanalyseerd door het pakket. Verder biedt het pakket functionaliteiten voor visualisatie van deze variabelen met behulp van typische grafische technieken. Het biedt ook algemene methoden voor gegevensverwerking voor het behandelen en opmaken van gegevens.

4. Gmodels

Het gmodels-pakket biedt verschillende hulpmiddelen in R voor het plotten van gegevens. Het bevat verschillende functies zoals glh.test die wordt gebruikt om een ​​algemene lineaire hypothese voor een regressiemodel te testen, af te drukken of samen te vatten. De functie maakt. contrasten zetten door mensen leesbare contrasten om in de vorm die R nodig heeft voor berekening. De matrix die wordt geretourneerd door make.contrasts kan worden gebruikt als argument voor het argument contrasten van modelfuncties. De functie coefFrame past een model voor elke subgroep gedefinieerd door en retourneert vervolgens een gegevensframe met één rij voor elke aanpassing en één kolom voor elke parameter. De geschatte functie berekent en test contrasten en andere geschatte lineaire functies van modelcoëfficiënten voor lm, glm, enz. De functie fit.contrast berekent en test willekeurige contrasten voor regressieobjecten.

5. Gplots

Dit pakket biedt visualisatiefunctionaliteit via veelzijdige programmeertools. De functies in het pakket werken op het concept van berekening en plotten. De grafische mogelijkheden van het pakket worden gedemonstreerd door verschillende functies zoals bandplot, boxplot2, col2hex, ci2d, hist2d, tekstplot, zinkplot, ballonpiloot, plotCI, plotmiddelen, enz. Met deze functies kunt u werken met instellingen met betrekking tot kleur, tekst en andere ingewikkelde grafische aspecten van de visualisatie. Ze behandelen ook complexe elementen die betrokken zijn bij op statistieken gebaseerde visualisatie, bijvoorbeeld lmplot2, residplotfuncties waarmee de gebruiker gedetailleerde regressiediagnose kan sturen via diagnostische plots. Als meerdere gegevens in hetzelfde gebied moeten worden geplot, maar met afzonderlijke assen, dan is dit mogelijk met behulp van de overplotfunctie in het pakket.

6. Ggplot2

Het is een van de zeer beroemde pakketten in R die uitgebreide visuele mogelijkheden biedt en zelfs de resultaten van complexe statistische en wiskundige technieken presenteert. De vele functionaliteiten van het pakket stellen de analist in staat om op de meest interactieve manier inzichten te ontlenen aan gegevens. De R-beschrijving voor de functie is "een systeem voor het declaratief maken van afbeeldingen op basis van de grafische grammatica". Deze grafische grammatica betekent dat de gebruiker 'ggplot2' moet vertellen over de manier waarop variabelen moeten worden toegewezen aan esthetiek, dus dit betekent in wezen dat het specificeren van welke grafische aspecten te gebruiken, en ggplot2 overeenkomstig zullen werken op basis van de details.

7. Lubridate

Dit R-pakket maakt het eenvoudiger om met datums en tijden te werken. Het lubridate-pakket maakt eenvoudige manipulatie van datum- en tijdgegevens mogelijk. Het ontleedt een getal en geeft een geschikte gegevensindeling, in feite verwerken de ontleedfuncties in het pakket een groot aantal indelingen en scheidingstekens die het ontleedproces vereenvoudigen. Een van de opvallende kenmerken is dat het pakket functionaliteiten biedt om datums met verschillende tijdzones te verwerken.

8. Hmisc

Het Hmisc-pakket, genaamd Harrell Miscellaneous, bevat veel functies die kunnen worden gebruikt voor gegevensanalyse, grafische afbeeldingen op hoog niveau en hulpprogramma's. Het bevat ook functies voor het berekenen van steekproefomvang en -kracht, het importeren en annoteren van gegevenssets, het berekenen van ontbrekende waarden, het bieden van geavanceerde tabelfunctionaliteit, clustering van variabelen, manipulatie van de tekenreeks, conversie van R-objecten naar HTML-code, etc.

9. Rooster

Het pakket biedt een datavisualisatiesysteem op hoog niveau dat is geïnspireerd op Trellis-graphics. Het legt de nadruk op multivariate gegevens. De krachtige visualisatiemogelijkheden van het pakket bieden de benodigde grafische oplossing. Enkele van de opmerkelijke functies in het pakket zijn B_07_cloud die helpt bij het produceren van een 3D-spreidingsplot en een draadframe-plot; D_level. kleuren, een functie voor het berekenen van valse kleuren die een numerieke of categorische variabele vertegenwoordigen; B_06_levelplot, een functie die niveauplots en contourplots genereert; A_01_Lattice, een functie die grafische Lattice-mogelijkheden biedt. B_09_tmd is een functie die Tukey Mean - Difference Plot genereert; B_11_oneway, een functie die past in het One-way Model. Het pakket biedt dus uitgebreide functionaliteiten voor visualisaties via verschillende functies.

10. MatrixModels

Dit pakket maakt modellering mogelijk met dunne en dichte 'Matrix'-matrices. Om dit te bereiken gebruikt het modulaire voorspelling en respons, moduleklassen. Alle functies van het pakket zijn even belangrijk, sommige zijn lm.fit.sparse, wat een fitterfunctie is voor schaarse lineaire modellen, solveCoef die oplost voor de coëfficiënten en coëfficiëntstijging, model. Een matrix die mogelijk schaarse ontwerp- of modelmatrices construeert, glm4 die past in gegeneraliseerde lineaire modellen.

11. Multcomp

Het pakket maakt meerdere vergelijkingen van k-groepen in algemene lineaire modellen mogelijk. Een lijst met negen standaardprocedures, te weten. Dunnet, Tukey, Sequen, AVE, Changepoint, Williams, Marcus, McDermott en Tetrade worden aan de gebruiker verstrekt en de gebruiker selecteert de vergelijkingen op basis van de vereiste. Daarnaast is er ook een gratis invoerinterface voor de contrastmatrix die speciale vergelijkingen mogelijk maakt. Het opmerkelijke kenmerk is dat de vergelijkingen zelf niet zijn beperkt tot een bepaald ontwerp, zoals evenwichtig of eenvoudig, maar dat de programma's zodanig zijn ontworpen dat ze geschikt zijn voor meerdere vergelijkingen binnen het algemene lineaire model dat covariaten, gecorreleerde middelen, ontbrekende waarden mogelijk maakt, enz.

12. OpenMx

Dit pakket behandelt in principe uitgebreide modellering van structurele vergelijkingen. Het biedt functionaliteiten om modellen voor structurele vergelijkingen te maken. Deze modellen kunnen worden gemanipuleerd met behulp van programmeren. De modellen kunnen worden gespecificeerd met matrices of paden zoals LISREL of RAM. Sommige van de typen modellen omvatten meerdere groepen, bevestigende factor, mengselverdeling, categoriale drempel, differentiële Fit-functies, enz.

13. Plyr

Het is een zeer belangrijk pakket dat functionaliteiten biedt voor gegevensmanipulatie. Het biedt hulpmiddelen voor het splitsen, toepassen en combineren van gegevens. Het wordt geleverd met een set hulpmiddelen die helpen bij het oplossen van veelvoorkomende problemen. Soms moeten we bijvoorbeeld een grote taak opsplitsen in kleinere taken die beheersbaar zijn, dan werken we op elk van de stukjes en dan tenslotte brengen we alle stukjes weer in elkaar.

14. Qcc

Het pakket krijgt betekenis vanwege de verschillende functies voor kwaliteitsanalyse die het biedt. Het biedt Shewhart-kwaliteitscontrolediagrammen voor gegevens over continu, attributen en tellingen. Onder andere belangrijke grafieken zijn Cusum- en EWMA-grafieken en curven van operationele kenmerken. Het biedt ook functionaliteit voor het analyseren van procesmogelijkheden. Pareto-diagram en oorzaak-en-gevolg diagram en multivariate controlekaarten zijn handige hulpmiddelen die door het pakket worden geleverd.

15. RandomForest

Zoals de naam al doet vermoeden, wordt dit pakket gebruikt om een ​​willekeurig forest-algoritme te bouwen. Het pakket implementeert het willekeurige forest-algoritme van Breiman, dat is gebaseerd op de originele FORTRAN-code van Beiman en Cutler. Het algoritme wordt gebruikt voor classificatie en regressie. Het pakket kan ook worden gebruikt in de modus zonder toezicht om de nabijheid van gegevenspunten te beoordelen.

16. Psych

Het is een pakket bedoeld voor een speciaal doel. Het pakket biedt een procedure voor psychologisch, psychometrisch en persoonlijkheidsonderzoek. Functies zijn voornamelijk bedoeld voor multivariate analyse met behulp van verschillende multivariate statistische technieken.

Conclusie-lijst van R-pakketten

Er zijn talloze pakketten in R en de toepassing van een pakket is afhankelijk van de vereisten. De community van de lijst met R-pakketten is erg snel gegroeid en elke dag wordt er een pakket toegevoegd. Meerdere pakketten kunnen vergelijkbare functionaliteiten bieden, maar de selectie van een pakket moet gebaseerd zijn op een zorgvuldige studie.

Aanbevolen artikelen

Dit is een gids voor een lijst met R-pakketten. Hier bespreken we de inleiding tot R-pakketten en enkele belangrijke pakketten van R. U kunt ook onze andere voorgestelde artikelen doornemen voor meer informatie -

  1. Java-pakketten
  2. Wat is JNDI in Java?
  3. JColorChooser
  4. R Programmering versus Python

Categorie: