Inleiding tot R-pakketten

Het pakket is een verzameling functies en gegevenssets. Pakketten helpen de functionaliteit in een programmeertaal te verbeteren. Als we databases willen opslaan en verwerken (dat wil zeggen SQL-achtige functionaliteiten met behulp van gegevensframes), kunnen we het dplyr-pakket in R. gebruiken. Pakketten bieden ook documentatie over het gebruik van de functies en gegevenssets in een bepaald pakket.

Waar vinden we pakketten?

Pakketten zijn via verschillende bronnen op internet beschikbaar. Er zijn echter bepaalde vertrouwde opslagplaatsen waar we de pakketten kunnen downloaden.

Hier zijn de twee belangrijke repositories die online beschikbaar zijn.

  • CRAN (Comprehensive R Archive Network): dit is de officiële R-community met een netwerk van FTP en webservers met de nieuwste code en documentatie van R. Voordat u uw pakketten online plaatst, doorloopt het een reeks tests die voldoen aan het CRAN-beleid .
  • GitHub: GitHub is een andere beroemde repository maar niet specifiek voor R. De online community kan hun pakketten delen met andere mensen en het wordt gebruikt voor versiebeheer is goed. GitHub is een open-source en heeft geen beoordelingsproces.

Lijst met nuttige R-pakketten

Er zijn verschillende pakketten in R en kunnen worden gedownload van CRAN of GitHub. Hieronder staan ​​de pakketten die voor specifieke doeleinden kunnen worden gebruikt.

1. Laden van de gegevens uit externe bronnen

  • Haven: R leest en schrijft gegevens van SAS.
  • DBI: communicatie tot stand brengen tussen de relationele database en R.
  • RSQlite: het wordt gebruikt om gegevens uit relationele databases te lezen.

2. Gegevensmanipulatie

  • Dplyr: het wordt gebruikt voor gegevensmanipulatie zoals subsetting, biedt snelkoppelingen voor toegang tot gegevens en genereert sql-query's.
  • Tidyr - Het wordt gebruikt om gegevens in kleine formaten om te zetten.
  • stringr - manipuleer string-expressies en tekenreeksen.
  • lubridate- Om te werken met gegevens en tijd.

3. Gegevensvisualisatie

  • Rgl: werken aan 3D-visualisaties.
  • ggvis: grammatica van afbeeldingen maken en bouwen.
  • googlevis: Google visualisatiehulpmiddelen gebruiken in R.

4. Web-gebaseerde pakketten

  1. XML: XML-documenten lezen en schrijven in R.
  2. Httpr: werken met http-verbindingen.
  3. Jsonlite: om json-gegevenstabellen te lezen.

R-pakketten verkrijgen

We kunnen de beschikbare pakketten die aanwezig zijn in R controleren met behulp van de onderstaande code.

  • available.packages (): Er zijn ongeveer 5200 pakketten beschikbaar in het CRAN-netwerk.

CRAN heeft taakweergaven waarin pakketten onder een bepaald onderwerp worden gegroepeerd.

R-pakketten installeren

We kunnen pakketten rechtstreeks via IDE of via opdrachten installeren. Om pakketten te installeren gebruiken we de onderstaande functie en geven we de pakketnaam op.

Syntaxis:

install.packages()

Code:

install.packages(“ggplot2”)

De bovenstaande code installeert het ggplot2-pakket en de afhankelijke pakketten indien aanwezig.

We kunnen meerdere pakketten tegelijk installeren door de namen van het pakket op te geven onder een tekenvector.

Syntaxis:

install.packages(c(“package 1”, ”package 2”, ”package 3”))

Code:

install.packages(c(“ggplot2”, ”slidify”, ”deplyr”))

Installeren met R Studio

Het voordeel van het gebruik van een R-studio is dat het een GUI (grafische gebruikersinterface) is. We kunnen de te installeren pakketten en de bron ervan kiezen.

We kunnen naar hulpmiddelen gaan -> Pakketten installeren.

R-pakketten laden

Na het installeren van het R-pakket moeten we ze in R laden om gebruik te kunnen maken van de geïnstalleerde pakketten.

We gebruiken de onderstaande functie om de pakketten te laden.

Syntaxis:

library(package name)

Opmerking: de pakketnaam hoeft niet tussen aanhalingstekens te worden vermeld.

Code:

library(ggplot2)

Er zijn bepaalde pakketten die berichten weergeven wanneer geladen. Sommigen van hen, niet doen. We kunnen de details van de geïnstalleerde bibliotheek bekijken met behulp van de onderstaande code.

Code:

library(ggplot2)
search()

Output:

"Pakket: rooster" "pakket: ggplot2" "pakket: merken"

"Package: knitr" "package: slidify" "tools: rstudio"

Uw eigen pakket maken

Voordat we ons eigen pakket maken. We moeten de onderstaande checklist in gedachten houden voordat we overgaan tot het maken van een pakket.

  • Het organiseren van de code is een van de belangrijkste dingen bij het schrijven van code in het pakket. We verliezen de helft van de tijd om naar de codelocatie te zoeken in plaats van de code te verbeteren. Plaats alle bestanden in een map die gemakkelijk toegankelijk is.
  • Het documenteren van de code helpt u het doel van code te begrijpen. Wanneer we de code niet vaak opnieuw bezoeken, vergeten we waarom we de code op een bepaalde manier hebben geschreven. Het kan mensen ook helpen uw code beter te begrijpen wanneer deze met hen wordt gedeeld.
  • Het delen van de scripts via e-mail is archaïsch geworden. De eenvoudige manier is om uw code te uploaden en te distribueren op GitHub. Het is mogelijk dat u feedback krijgt die u kan helpen de code te verbeteren.

Om uw eigen pakket te maken, moeten we het devtools-pakket installeren.

Code:

install.packages("devtools")

Om u te helpen bij de documentatie kunnen we het onderstaande pakket gebruiken.

Code:

install.packages("roxygen2")

Na het installeren van het pakket devtools. U kunt uw eigen pakket maken.

Code:

devtools::create ("packagename")

In de plaats van "pakketnaam" kunt u de gewenste naam opgeven. U kunt nu uw functies onder dit pakket toevoegen.

U kunt dezelfde bestandsnaam maken als uw functienaam.

Syntaxis:

Devtools:create(“firstpackage”)

Distributiepakket

U kunt uw pakket op github distribueren met behulp van het devtools-pakket.

We gebruiken de onderstaande code om ons pakket op github te distribueren.

Code:

devtools::install_github("yourusername/firstpackage")

Je kunt je github-gebruikersnaam en pakketnaam opgeven die je hierboven hebt gemaakt.

Hier zijn de vereiste bestanden voor een pakket

  • functies
  • Documentatie
  • Gegevens

Zodra we alle bovenstaande bestanden hebben, kunnen we deze in de repository plaatsen.

Aanbevolen artikelen

Dit is een gids voor R-pakketten. Hier bespreken we de lijst met nuttige R-pakketten, het installeren van pakketten met R studio en het maken van uw eigen pakket, enz. U kunt ook de volgende artikelen bekijken voor meer informatie -

  1. Wat is R-programmeertaal?
  2. Carrières in R Programmering
  3. R Programmering versus Python
  4. MySQL versus SQLite
  5. Lijst met R-pakketten

Categorie: