Inleiding tot R Interviewvragen en antwoorden

R is overal. Of het nu een wetenschapper is die de numerieke gegevens over haar experimenten probeert te verzamelen of een analist die regressie uitvoert om een ​​zakelijk gebruik op te lossen, R is de programmeertaal van eerste keus. R kan zelfs veel meer dan statistische hulpmiddelen, het kan worden gebruikt voor gegevensverwerking, visualisaties en afbeeldingen. In dit informatietijdperk is R de belangrijkste taal in de Data Science-toolkit en er is een enorme vraag naar.

Dus je hebt eindelijk je droombaan gevonden in R, maar je vraagt ​​je af hoe je het R-interview kunt kraken en wat de waarschijnlijke 2018 R-interviewvragen kunnen zijn. Elk interview is anders en de reikwijdte van een baan is ook anders. Met dit in gedachten hebben we de meest voorkomende interviewvragen en antwoorden voor 2019 R ontworpen om u te helpen succes te behalen in uw interview.

Hieronder is de lijst met 2019 R-interviewvragen en -antwoorden, die tijdens een interview kunnen worden gesteld. Deze top interviewvragen zijn verdeeld in twee delen:

Deel 1 - Interviewvragen (R)

Dit eerste deel behandelt basisvragen en antwoorden over R-interviews

1. Wat is het nut van de functie lm ()?

Antwoord:
'lm' staat voor een lineair model. In R lm () wordt de functie gebruikt om regressiemodellen te maken. De twee belangrijkste argumenten voor de functie lm () zijn formule en gegevens. De formule definieert het regressiemodel en gegevens zijn de gegevensset waarop de regressie moet worden uitgevoerd.

2. Geef een voorbeeld van de methode tapply ()

Antwoord:
Beschouw twee geordende vectoren
1) studenten verdeeld over verschillende scholen (s1 is de school van de eerste student, s2 is de school van de tweede student, enz.)
> studenten <- c (“s1 ″, ” s2 ″, ”s1 ″, ” s3 ″, ”s3 ″, ” s2 ”)

2) Percentage van de cijfers van elke student
> merken <- c (80, 90, 75, 67, 96, 67)
> betekent <- tapply (cijfers, studenten, gemiddelde)
> betekent
s1 s2 s3
77, 5 78, 5 81, 5

De functie tapply () past een functie 'mean ()' toe op 'argument' eerste argument, gegroepeerd door tweede argument 'studenten'

Laten we doorgaan naar de volgende R-interviewvragen.

3. Hoe lijsten wijzigen en samenstellen? Toon met een voorbeeld.

Antwoord:
Lijsten constructie:
> Lst <- lijst (naam = "Jack", leeftijd = 23, nr. Auto's = 3, auto's. Namen = c ("Wagon", "Bumper", "Jazz"))

Lijst modificatie:
> Lst $ cars.names (1) Lst ((4)) (1) <- "WagonR"

4.Wat zijn verschillende gegevensstructuren in R?

Antwoord:
Dit zijn de basisvragen voor R-interviews die in een interview worden gesteld. R heeft 5 datastructuren: Vector, Array, Matrix, List en dataframes. Waarvan vectoren, arrays en matrices homogeen zijn.
- Vectoren zijn de meest voorkomende gegevensstructuur in R. Het is een eendimensionaal object dat een reeks waarden aangeeft. Een array is een multidimensionale generalisatie van vectoren. Een matrix is ​​een speciaal geval van een array, het is tweedimensionaal.
- Een lijst bestaat uit een geordende set objecten die van verschillende typen of modi kunnen zijn. Een gegevensframe is als een tabel of een matrix met kolommen van verschillende modi.

5. Hoe gaan we om met ontbrekende waarden in de functies sum (), prod (), min (), max ()?

Antwoord:
Overweeg een vector:
> x <- c (3, 6, 2, NA, 1)

De som ervan resulteert in:
> som (x)
(1) NA

We kunnen het argument na.rm echter instellen op True om de ontbrekende waarden te negeren
> som (x, na.rm = WAAR)
(1) 12

6. Wat is het verschil tussen NA en NaN? Hoe weten we of de vector een van beide bevat?

Antwoord:
NA staat gelijk aan ontbrekende waarde. In gevallen waarin componenten van vectoren niet volledig bekend zijn, worden de ontbrekende elementen aangeduid met NA.
Aan de andere kant worden de onbepaalde waarden die tijdens berekeningen resulteren aangegeven door NaN. Een voorbeeld van een NaN-resultaat kan 0/0 zijn.
We kunnen controleren of een waarde NA of NaN is met de functie is.na (). De functie is.nan (X) retourneert alleen true voor NaN.

7. Hoe schrijf je eigen functies?

Antwoord:
Een functie in R kan als volgt worden geschreven:
> functienaam <- functie (arg1, arg2, …) expression_in_R
expression_in_R is meestal een set van verschillende samengeknepen expressies.

Deel 2 - Interviewvragen (R)

Laten we nu eens kijken naar de geavanceerde R-interviewvragen.

8. Wat zijn matrices in R?

Antwoord:
Een Matrix is ​​een array met twee subscripts. Het is een belangrijk speciaal geval van array en R biedt veel functies die specifiek zijn voor matrices.
Bijvoorbeeld, t (X) geeft een transpositie van Matrix X, operator% *% wordt gebruikt voor matrixvermenigvuldiging, nrow (X) en ncol (X) geven het aantal rijen en kolommen, enz.

9. Hoe kunnen lineaire vergelijkingen worden opgelost met behulp van matrixinversie?

Antwoord:
Lineaire vergelijkingen in matrixvorm kunnen worden weergegeven door:
M * X = C waarbij M een nxn-matrix van coëfficiënten is, X een vectorvariabele met maat n is en C een constante vector met maat n is.
Om deze vergelijking in R op te lossen, kunnen we de functie solve () als volgt gebruiken:
X = oplossen (M, C)

Laten we doorgaan naar de volgende R-interviewvragen.

10. Wat is een interkwartielbereik (IQR) en hoe bereken je het in R?

Antwoord:
Kwartielen zijn de waarden die de gegevensset verdelen. Elk kwartiel op basis van zijn positie in een geordende dataset wordt het eerste (Q1), tweede (Q2) en derde (Q3) kwartiel genoemd. Q2 is de mediaan van de gegevensset. Q1 is de mediaan van de eerste helft, terwijl Q3 de mediaan is van de bovenste helft van een geordende gegevensset. IQR = Q3-Q1

In R wordt IQR berekend door de IQR-functie aan te roepen:
> IQR (gegevensset)

11. Wat doet de plot () functie?

Antwoord:
Dit zijn de veelgestelde R-interviewvragen in een interview. De plot is een generieke functie en afhankelijk van het type argumenten levert het een type plot op. Bijvoorbeeld,
Als x en y vectoren zijn, produceert plot (x, y) een spreidingsplot van y tegen x.
Als z een lijst is met twee elementen x en y of een matrix met twee kolommen, doet plot (z) hetzelfde als hierboven.

12. Hoe een functie toe te passen op alle kolommen van een gegevensframe?

Antwoord:
We kunnen de functie toepassen () gebruiken. Er zijn twee argumenten nodig: het gegevensframe en de functie die moet worden toegepast.

13. Hoe datakaders naar matrices te converteren en waarom is dit vereist?

Antwoord:
De functie as.matrix () wordt gebruikt om een ​​gegevensframe om te zetten in een matrix. R biedt krachtige bibliotheken die specifiek zijn voor matrices. Daarom kunnen dataframes omgezet in matrices worden geanalyseerd met behulp van deze matrixformules.

Laten we doorgaan naar de volgende R-interviewvragen.

14. Hoe tekenreeksen opmaken in datums in R?

Antwoord:
U kunt de functie as.Date () gebruiken, die een vector van tekenreeksen en een indeling gebruikt om ze in een datumobject om te zetten.
Bijvoorbeeld,
> as.Date (“22: 2: 2001 ″, format =”% d:% m:% Y ”)

(1) “2001-02-22”

15. Vind het kleinste en het grootste getal tussen 7000 en 70000 dat deelbaar is door 233.

Antwoord:
> Zoeken (functie (x) x %% 233 == 0, 7000: 70000)
(1) 7223

> Zoeken (functie (x) x %% 233 == 0, 7000: 70000, rechts = WAAR)
(1) 69900

Conclusie

We hebben interviewvragen behandeld die betrekking hebben op enkele van de meest voorkomende concepten in R. Aangezien R een uitgebreide bibliotheek ondersteunt, is werken aan R vaak een continu leerproces. Bovendien kunt u contact houden met de R-Community en de aanvullende bronnen op CRAN bekijken. Al het beste voor je interview!

Aanbevolen artikel

Dit is een gids voor Lijst met R-interviewvragen en -antwoorden, zodat de kandidaat deze R-interviewvragen gemakkelijk kan beantwoorden. U kunt ook de volgende artikelen bekijken voor meer informatie -

  1. Informatica Interviewvragen op basis van scenario's
  2. Nuttige 10 vragen over het Tableau-interview
  3. 10 geweldige sollicitatievragen voor Data Engineer
  4. Sollicitatievragen voor Software Testing
  5. SAP versus Oracle Wat zijn de voordelen