Overzicht van R-gegevensframe
Dataframes zijn een lijst met vectoren van gelijke lengte. Het verschil tussen matrix- en gegevensframes is echter dat de gegevensframes verschillende soorten gegevens accepteren. (Teken, cijfer, enz.). In dit onderwerp gaan we meer te weten komen over R Data Frame.
Voordelen van het gebruik van dataframes
- Gedistribueerde verzameling van gegevens en georganiseerd.
- Het heeft betere optimalisaties in vergelijking met een relationele database.
- Bevat een verscheidenheid aan gegevens die heterogeen zijn.
Een gegevensframe maken in R
We maken data_frame. Hieronder is het voorbeeld om een dataframe te declareren.
Data_frame <- data.frame (variable 1, variable 2, variable n…)
In het bovenstaande voorbeeld hebben we de variabelen niet gedefinieerd. Laten we nu kijken hoe we waarden toewijzen aan variabelen en deze opslaan in het gegevensframe.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
Output:
Nummer alfa Booleans
1 2 x WAAR
2 3 y WAAR
3 4 z ONWAAR
Structuur van dataframe
Wanneer we de structuur van een bepaald dataframe willen weten. We kunnen de onderstaande functie gebruiken.
Ster ()
str(Data_frame)
Output:
Nummer: num 2 3 4
alpha: Factor met 3 niveaus "x", "y", "z": 1 2 3
Booleans: logi WAAR WAAR WAAR
Specifieke gegevens uit het gegevensframe extraheren
1. Gebruik de kolomnaam
We kunnen een bepaalde set gegevens uit het gegevensframe extraheren.
Laten we uit ons bovenstaande voorbeeld alleen de eerste kolom uit het gegevensframe extraheren, namelijk Nummer.
Data_ frame <- data. Frame(Number)
Output:
Aantal
1 2
2 3
3 4
2. Gebruik de rijen
We kunnen de gegevens uit de rijen extraheren, net als het onderstaande voorbeeld.
Laten we aannemen dat we slechts twee rijen van de kolom Nummer willen afdrukken.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(1:2, ) print(output)
Output:
Nummer alfa Booleans
1 2 x WAAR
2 3 y WAAR
3 4 z ONWAAR
------------
Nummer alfa Booleans
1 2 x WAAR
2 3 y WAAR
We kunnen het verschil in de eerste en tweede uitvoer waarnemen.
3. Afdrukken van specifieke rijen en kolommen
We kunnen ook specifieke rijen en kolommen afdrukken.
In het onderstaande voorbeeld drukken we eerste en tweede rijen, kolommen af
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(c(1, 2), c(1, 2)) print(output)
Output:
Nummer alfa Booleans
1 2 x WAAR
2 3 y WAAR
3 4 z ONWAAR
-------------
Nummer alfa
1 2 x
2 3 j
4. Een andere kolom toevoegen aan het gegevensframe
We kunnen een andere kolom met waarden aan het gegevensframe toevoegen.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- Data_frame
print(out)
Output:
Nummer alfa Booleans-klasse
1 2 x WAAR A
2 3 y WAAR B
3 4 z ONWAAR C
5. Een rij toevoegen aan het gegevensframe
We gebruiken de functie rbind om een nieuwe rij toe te voegen aan het bestaande gegevensframe.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- rbind(Data_frame, c(5, "x", FALSE, "D"))
print(out)
Output:
Nummer alfa Booleans-klasse
1 2 x WAAR A
2 3 y WAAR B
3 4 z ONWAAR C
4 5 x ONWAAR D
6. Combineren van beide dataframes
We kunnen ook twee dataframes combineren om een enkele output te produceren.
Om twee gegevensframes te combineren, hebben we dezelfde kolom voor de gegevensframes nodig.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame1 <- data.frame(Number, alpha, Booleans)
print(Data_frame1)
Number <- c(4, 5, 6)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame2 <- data.frame(Number, alpha, Booleans)
print(Data_frame2)
out <- rbind(Data_frame1, Data_frame2)
print(out)
Output:
Nummer alfa Booleans
1 2 x WAAR
2 3 y WAAR
3 4 z ONWAAR
--------------
Nummer alfa Booleans
1 4 x WAAR
2 5 j WAAR
3 6 z ONWAAR
--------------
Nummer alfa Booleans
1 2 x WAAR
2 3 y WAAR
3 4 z ONWAAR
4 4 x WAAR
5 5 y WAAR
6 6 z ONWAAR
Gegevenskaders inspecteren
Hieronder staan de verschillende manieren om een dataframe te inspecteren en biedt informatie over een dataframe net zoals de bovenstaande sterfunctie.
1. Namen - Geeft de namen van de variabelen in het dataframe
Syntaxis : names(data frame name)
Voorbeeld
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
names(Data_frame)
output : (1) "Nummer" "alpha" "Booleans"
2. Samenvatting - biedt de statistieken van het gegevensframe.
Syntaxis: summary(data frame name)
Voorbeeld
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
summary(Data_frame)
Output:
Nummer alfa Booleans
Min. : 2.0 x: 1 Modus: logisch
1st Qu.:2.5 y: 1 FALSE: 1
Mediaan: 3, 0 z: 1 WAAR: 2
Gemiddelde: 3, 0 NA's: 0
3e vraag: 3.5
Max. : 4.0
3. Hoofd: geeft de gegevens voor de eerste paar rijen.
Syntaxis: Head( name of the data frame)
Voorbeeld
Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
head(Data_frame)
Output:
Nummer alfa Booleans
1 2 x WAAR
2 3 y WAAR
3 4 z ONWAAR
4 5 een WAAR
5 6 b ONWAAR
6 7 c ONWAAR
4. Staart: drukt de laatste paar rijen in het gegevensframe af.
Syntaxis: tail( name of the data frame)
Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
tail(Data_frame)
Output:
Nummer alfa Booleans
5 6 b ONWAAR
6 7 c ONWAAR
7 8 d ONWAAR
8 9 f ONWAAR
9 10 g ONWAAR
10 11 j FALSE
Conclusie
Dataframes zijn een belangrijk concept in R-programmering. Het is eenvoudig maar krachtig in het maken van gegevenssets die kunnen worden gewijzigd en gemakkelijk toegankelijk zijn. Net als matrix zijn de gegevenssets toegankelijk via rijen en kolomnamen, waardoor gegevens eenvoudig kunnen worden toegevoegd en verwijderd.
Aanbevolen artikelen
Dit is een gids voor R Data Frame. Hier bespreken we het creëren van een gegevenskader in R met de structuur en het extraheren van specifieke gegevens uit het gegevenskader. U kunt ook de volgende artikelen bekijken voor meer informatie -
- Gegevenstypen in C
- Data Science Carrière
- Big Data-technologieën
- Data Science Platform
- Java Booleans