Overzicht van R-gegevensframe

Dataframes zijn een lijst met vectoren van gelijke lengte. Het verschil tussen matrix- en gegevensframes is echter dat de gegevensframes verschillende soorten gegevens accepteren. (Teken, cijfer, enz.). In dit onderwerp gaan we meer te weten komen over R Data Frame.

Voordelen van het gebruik van dataframes

  • Gedistribueerde verzameling van gegevens en georganiseerd.
  • Het heeft betere optimalisaties in vergelijking met een relationele database.
  • Bevat een verscheidenheid aan gegevens die heterogeen zijn.

Een gegevensframe maken in R

We maken data_frame. Hieronder is het voorbeeld om een ​​dataframe te declareren.

Data_frame <- data.frame (variable 1, variable 2, variable n…)

In het bovenstaande voorbeeld hebben we de variabelen niet gedefinieerd. Laten we nu kijken hoe we waarden toewijzen aan variabelen en deze opslaan in het gegevensframe.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)

Output:

Nummer alfa Booleans

1 2 x WAAR

2 3 y WAAR

3 4 z ONWAAR

Structuur van dataframe

Wanneer we de structuur van een bepaald dataframe willen weten. We kunnen de onderstaande functie gebruiken.

Ster ()

str(Data_frame)

Output:

Nummer: num 2 3 4

alpha: Factor met 3 niveaus "x", "y", "z": 1 2 3

Booleans: logi WAAR WAAR WAAR

Specifieke gegevens uit het gegevensframe extraheren

1. Gebruik de kolomnaam

We kunnen een bepaalde set gegevens uit het gegevensframe extraheren.

Laten we uit ons bovenstaande voorbeeld alleen de eerste kolom uit het gegevensframe extraheren, namelijk Nummer.

Data_ frame <- data. Frame(Number)

Output:

Aantal

1 2

2 3

3 4

2. Gebruik de rijen

We kunnen de gegevens uit de rijen extraheren, net als het onderstaande voorbeeld.

Laten we aannemen dat we slechts twee rijen van de kolom Nummer willen afdrukken.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(1:2, ) print(output)

Output:

Nummer alfa Booleans

1 2 x WAAR

2 3 y WAAR

3 4 z ONWAAR

------------

Nummer alfa Booleans

1 2 x WAAR

2 3 y WAAR

We kunnen het verschil in de eerste en tweede uitvoer waarnemen.

3. Afdrukken van specifieke rijen en kolommen

We kunnen ook specifieke rijen en kolommen afdrukken.

In het onderstaande voorbeeld drukken we eerste en tweede rijen, kolommen af

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(c(1, 2), c(1, 2)) print(output)

Output:

Nummer alfa Booleans

1 2 x WAAR

2 3 y WAAR

3 4 z ONWAAR

-------------

Nummer alfa

1 2 x

2 3 j

4. Een andere kolom toevoegen aan het gegevensframe

We kunnen een andere kolom met waarden aan het gegevensframe toevoegen.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- Data_frame
print(out)

Output:

Nummer alfa Booleans-klasse

1 2 x WAAR A

2 3 y WAAR B

3 4 z ONWAAR C

5. Een rij toevoegen aan het gegevensframe

We gebruiken de functie rbind om een ​​nieuwe rij toe te voegen aan het bestaande gegevensframe.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- rbind(Data_frame, c(5, "x", FALSE, "D"))
print(out)

Output:

Nummer alfa Booleans-klasse

1 2 x WAAR A

2 3 y WAAR B

3 4 z ONWAAR C

4 5 x ONWAAR D

6. Combineren van beide dataframes

We kunnen ook twee dataframes combineren om een ​​enkele output te produceren.

Om twee gegevensframes te combineren, hebben we dezelfde kolom voor de gegevensframes nodig.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame1 <- data.frame(Number, alpha, Booleans)
print(Data_frame1)
Number <- c(4, 5, 6)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame2 <- data.frame(Number, alpha, Booleans)
print(Data_frame2)
out <- rbind(Data_frame1, Data_frame2)
print(out)

Output:

Nummer alfa Booleans
1 2 x WAAR
2 3 y WAAR
3 4 z ONWAAR
--------------
Nummer alfa Booleans
1 4 x WAAR
2 5 j WAAR
3 6 z ONWAAR

--------------

Nummer alfa Booleans
1 2 x WAAR
2 3 y WAAR
3 4 z ONWAAR
4 4 x WAAR
5 5 y WAAR
6 6 z ONWAAR

Gegevenskaders inspecteren

Hieronder staan ​​de verschillende manieren om een ​​dataframe te inspecteren en biedt informatie over een dataframe net zoals de bovenstaande sterfunctie.

1. Namen - Geeft de namen van de variabelen in het dataframe

Syntaxis : names(data frame name)

Voorbeeld

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
names(Data_frame)

output : (1) "Nummer" "alpha" "Booleans"

2. Samenvatting - biedt de statistieken van het gegevensframe.

Syntaxis: summary(data frame name)

Voorbeeld

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
summary(Data_frame)

Output:

Nummer alfa Booleans
Min. : 2.0 x: 1 Modus: logisch
1st Qu.:2.5 y: 1 FALSE: 1
Mediaan: 3, 0 z: 1 WAAR: 2
Gemiddelde: 3, 0 NA's: 0
3e vraag: 3.5
Max. : 4.0

3. Hoofd: geeft de gegevens voor de eerste paar rijen.

Syntaxis: Head( name of the data frame)

Voorbeeld

Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
head(Data_frame)

Output:

Nummer alfa Booleans
1 2 x WAAR
2 3 y WAAR
3 4 z ONWAAR
4 5 een WAAR
5 6 b ONWAAR
6 7 c ONWAAR

4. Staart: drukt de laatste paar rijen in het gegevensframe af.

Syntaxis: tail( name of the data frame)

Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
tail(Data_frame)

Output:

Nummer alfa Booleans
5 6 b ONWAAR
6 7 c ONWAAR
7 8 d ONWAAR
8 9 f ONWAAR
9 10 g ONWAAR
10 11 j FALSE

Conclusie

Dataframes zijn een belangrijk concept in R-programmering. Het is eenvoudig maar krachtig in het maken van gegevenssets die kunnen worden gewijzigd en gemakkelijk toegankelijk zijn. Net als matrix zijn de gegevenssets toegankelijk via rijen en kolomnamen, waardoor gegevens eenvoudig kunnen worden toegevoegd en verwijderd.

Aanbevolen artikelen

Dit is een gids voor R Data Frame. Hier bespreken we het creëren van een gegevenskader in R met de structuur en het extraheren van specifieke gegevens uit het gegevenskader. U kunt ook de volgende artikelen bekijken voor meer informatie -

  1. Gegevenstypen in C
  2. Data Science Carrière
  3. Big Data-technologieën
  4. Data Science Platform
  5. Java Booleans

Categorie: