Inleiding tot R-snaarfuncties

R-taal of R-stringfuncties zijn voornamelijk bedoeld voor grafische weergave van de gegevens, statistische analyse van de gegevens en rapportage. het is een open source taal. de naamgevingsconventie van deze taal is afgeleid van de eerste letters van de grondleggers van deze taal, zij zijn Ross Ihaka en Robert Gentleman. Het is een geïnterpreteerde programmeertaal. Het heeft de mogelijkheid om te integreren met verschillende andere taalprocedures, namelijk C ++, Python, enz. Momenteel is R 's werelds meest gebruikte programmeertaal.

Kenmerken van R-snaarfuncties

De belangrijkste kenmerken van R-taal zijn zoals hieronder,

  • Een fijn ontwikkelde en zeer eenvoudige statistische taal.
  • Opslag en gegevensverwerking zijn zeer efficiënt ingebed in R.
  • Het biedt een grote reeks geclassificeerde hulpmiddelen die helpen bij gegevensanalyse
  • R biedt ook bibliotheken voor het verkrijgen van grafische weergaven van de gegevens

R String Functies Manipulatie

Hieronder wordt de lijst met R-stringmanipulatiefuncties gegeven.

1. Grep () in R-tekenreeksfuncties

Wordt gebruikt om een ​​patroon in de gegevens te matchen en het patroon te vervangen door een andere tekenreeks. De grep-functie kan op meerdere manieren worden uitgedrukt in R-talen zijn regexpr, gregexpr grep, grepl en regexec.

Bijv: grep (patroon, x, negeren. Geval = ONWAAR, perl = ONWAAR, waarde = ONWAAR, vast = ONWAAR, gebruik Bytes = ONWAAR, omkeren = ONWAAR)

argumenten:

  • Patroon - tekenreeks met een gebruikelijke uitdrukking waarvan wordt aangenomen dat deze gelijk is aan de gegeven tekenvector.
  • X, tekst - Een object dat kan worden beperkt als een teken tot een tekenvector.
  • Negeren. Hoofdletters - (Onwaar - Patroonovereenkomst werkt hoofdlettergevoelig, Waar - Patroonovereenkomst werkt hoofdlettergevoelig)
  • Perl - Om Perl-compatibele expressies te bepalen, worden vooral regexprns gebruikt.
  • Waarde - Als een gevonden match true anders false oplevert,
  • Gebruik bytes - Als TRUE daarna wordt het matchen byte voor byte gedaan in plaats van karakter voor karakter.
  • Omkeren - Retourneert indices als Waar,
  • Vervanging - De vervangende string,

2. Nchar ()

Wordt gebruikt om het aantal tekens in een vector te tellen. Neemt een vector in tekenreeksindeling als argument en retourneert een andere numerieke vector die de telling van de tekenreeks bevat.

Bijv: nchar (x, type = "tekens", allowNA = FALSE, keepNA = NA)

argumenten:

  • X - Vector string.
  • Type - Type, van de tekenreeks, gebruikt de drie meest voorkomende genoemde zijn ("bytes", "tekens", "breedte").
  • AllowNA - geeft aan of de 'Niet van toepassing' als uitvoer kan worden geretourneerd.
  • KeepNA - Moet 'Niet van toepassing' worden geretourneerd wanneer X niet wordt gevonden.

3.Substr ()

Wordt gebruikt om de substringwaarde van de tekenvector te kiezen.

Bijv: substr (x, start, stop)

argumenten:

  • X, tekst - De vector charter-string.
  • Start, First - geheel getal. Begin van het element dat naar verwachting zal worden vervangen
  • Stop, Last - geheel getal. hier vindt vervanging plaats aan het einde van de string

4. strsplit () in R-tekenreeksfuncties

Wordt gebruikt om een ​​bestaande vectorreeks in meerdere substrings te splitsen volgens de substring-overeenkomsten die erin worden gevonden

Bijv: strsplit (x, split, fixed = FALSE, perl = FALSE, useBytes = FALSE)

argumenten:

  • X - Tekenvector die wordt bespuwd.
  • Splitsen - tekenvector die fungeert als scheidingsteken.
  • Opgelost - Maakt een gelijke verdeling als deze als waar wordt doorgegeven
  • Perl - Moeten Perl-compatibele regexps worden gebruikt?
  • UseBytes - Wanneer het als true wordt doorgegeven, wordt byte per byte matching in plaats van karakter per karakter geactiveerd

5. Regexpr ()

Meer dan grep geeft de regexpr de index waar een geldige overeenkomst begint en de overeenkomende reekslengte wanneer geen overeenkomst wordt gevonden. -1 waarde wordt geretourneerd.

Bijvoorbeeld: regexpr (patroon, tekst, ignore.case = FALSE, perl = FALSE, fixed = FALSE, useBytes = FALSE)

argumenten:

  • Patroon - tekenreeks met een gebruikelijke uitdrukking waarvan wordt aangenomen dat deze gelijk is aan de gegeven tekenvector.
  • X - Karakter Vector
  • Ignore.case - (False - Patroonaanpassing werkt hoofdlettergevoelig, True - Patter-aanpassing werkt hoofdlettergevoelig)
  • Perl - Om Perl-compatibele expressies te bepalen, worden vooral regexprns gebruikt
  • Waarde - Als een gevonden match true anders false retourneert
  • UseBytes - Als TRUE daarna wordt het matchen byte voor byte gedaan in plaats van karakter voor karakter.
  • Omkeren - Retourneert indices als Waar

6. Gregexpr () in R-stringfuncties

De gregexpr geeft als resultaat een lijst met een vergelijkbare lengte als een tekst waarvan elk element een vergelijkbare vorm heeft als de retourwaarde voor regexpr, behalve dat de voorlopige posities van elke (onsamenhangende) wedstrijd worden gegeven.

Syntaxis: gregexpr (patroon, tekst, ignore.case = FALSE, perl = FALSE, fixed = FALSE, useBytes = FALSE, extract = FALSE)

argumenten:

  • Patroon - tekenreeks met een gebruikelijke uitdrukking waarvan wordt aangenomen dat deze gelijk is aan de gegeven tekenvector.
  • X - Karakter Vector
  • Ignore.case - (False - Pattern matching werkt hoofdlettergevoelig, True - Pattern matching werkt hoofdlettergevoelig)
  • Perl - Om Perl-compatibele expressies te bepalen, worden vooral regexprns gebruikt
  • Waarde - Als een gevonden match true anders false retourneert
  • UseBytes - Als TRUE daarna wordt het matchen byte voor byte gedaan in plaats van karakter voor karakter.
  • Omkeren - Retourneert indices als Waar
  • Extraheren - Wanneer een logische indicatie wordt gekoppeld, wordt een extract van de substring gemaakt en teruggestuurd

7. Regexec ()

De regexec () in R String Functions lijkt erg op regexpr () behalve dat de indices tussen haakjes de overeenkomstige sub-expressies worden geretourneerd

Syntaxis: regexec (patroon, tekst, ignore.case = FALSE, perl = FALSE, fixed = FALSE, useBytes = FALSE)

argumenten:

  • Patroon - tekenreeks met een gebruikelijke uitdrukking waarvan kan worden aangenomen dat deze gelijk is aan de gegeven tekenvector.
  • X - Karakter Vector
  • Ignore.case - (False - Patroonaanpassing werkt hoofdlettergevoelig, True - Patter-aanpassing werkt hoofdlettergevoelig)
  • Perl - Om Perl-compatibele expressies te bepalen, worden vooral regexprns gebruikt
  • Waarde - Als een gevonden match true anders false retourneert
  • UseBytes - Indien TRUE daarna wordt de matching byte voor byte gedaan in plaats van karakter voor karakter.
  • Omkeren - Retourneert indices als Waar

Aanbevolen artikelen

Dit is een gids voor R String Functions geweest. Hier hebben we het concept, functies, manipulatie van R-snaarfuncties met voorbeeld en argumenten besproken. U kunt ook onze andere voorgestelde artikelen doornemen voor meer informatie -

  1. JavaScript-stringfuncties
  2. Oracle String-functies
  3. T-SQL String-functies
  4. VBScript String-functies
  5. Regex-functies in Python (voorbeeld)