Inleiding tot gegevensframes in R
Een gegevensframe is een 2D (tweedimensionale) matrixachtige structuur waarin verschillende gegevenstypen zoals tekens, cijfers, enz. Worden geaccepteerd. Het gegevensframe is een subset van een lijst die elk onderdeel van gelijke lengte heeft. Kort gezegd is het gegevensframe een tabel waarin elke kolom waarden van één variabele bevat en elke rij één set waarden uit elke kolom bevat.
Er zijn enkele kenmerken van het gegevensframe.
- De kolomnaam is verplicht
- Rijnamen moeten uniek zijn
- Het aantal items in elke kolom moet hetzelfde zijn
Stappen voor het maken van gegevensframes in R
Laten we beginnen met het maken van een gegevensframe dat hieronder wordt uitgelegd,
Stap 1: Maak een gegevensframe van een klas in een school.
Code:
tenthclass = data.frame(roll_number = c(1:5), Name = c("John", "Sam", "Casey", "Ronald", "Mathew"),
Marks = c(77, 87, 45, 68, 95), stringsAsFactors = FALSE)
print(tenthclass)
Wanneer we deze code uitvoeren, krijgen we een gegevensframe als dit.
Output:
Hier in ons voorbeeld is het dataframe erg klein, maar in het echte leven hebben we veel gegevens. Dus om de structuur van gegevens te begrijpen, geven we de functie Str () door.
Stap 2: We voegen de onderstaande regel toe aan onze code.
Code:
Str(tenthclass)
Als we de hele code uitvoeren, krijgen we uitvoer.
Output:
De bovenstaande output betekent dat we 5 observaties van 3 variabelen hebben. Vervolgens wordt het gegevenstype van elke variabele uitgelegd. Zoals in ons voorbeeld is het rolnummer een geheel getal, is de naam een teken en zijn de tekens genummerd.
Zodra we de structuur van de gegevens begrijpen, zullen we de onderstaande code doorgeven om de gegevens statistischer te begrijpen.
Stap 3: Nu zullen we een samenvatting () functie gebruiken
Code:
summary(tenthclass)
Output:
De samenvatting geeft een beter inzicht in onze gegevens. Het zal ons vertellen om mediaan, kwartiel, Max en Min te betekenen. Deze dingen zullen ons helpen om een betere beslissing te nemen.
Hoe gegevens uit gegevensframes in R te extraheren?
Hier zullen we doorgaan met het bovenstaande geval. Laten we aannemen dat we de naam van de student in de tiende klas willen weten, gewoon de naam. Dus hoe gaan we extraheren?
Ons gegevensframe ziet er zo uit.
roll_number Naammarkeringen
1 1 Johannes 77
2 2 Sam 87
3 3 Casey 45
4 4 Ronald 68
5 5 Mathew 95
Om de naam als uitvoer te krijgen, geven we de volgende code door.
Code:
onlyname = tenthclass$Name
print(onlyname)
Output:
Als we de code breken, plaatsen we het dollarteken gewoon tussen de naam van ons gegevensframe en de naam van de variabele die we als uitvoer willen.
Overweeg nu een situatie, de leraar wil alles weten over rol nummer 2, zoals zijn naam en hoeveel hij heeft gescoord.
Hier hebben we alles over rol nummer 2 nodig, dus we geven de onderstaande code door.
Code:
result_rollnumber2 = tenthclass(c(2), c(1:3)) print(result_rollnumber2)
Output:
Uitvouwen in gegevenskaders
Het gegevensframe kan worden vergroot en verkleind door kolommen en rijen toe te voegen of te verwijderen.
1. Rij toevoegen
We hebben twee dataframes. Eén dataframe behoort tot klasse tiende sectie A en een ander dataframe behoort tot klasse tiende sectie B. Nu worden deze verschillende secties samengevoegd tot een enkele klasse.
Voorbeeld # 1: Klasse 10 A
Code:
tenthclass_sectionA = data.frame(roll_number = c(1:5),
Name = c("John", "Sam", "Casey", "Ronald", "Mathew"),
Marks = c(77, 87, 45, 68, 95), stringsAsFactors = FALSE)
print(tenthclass_sectionA)
Output:
Voorbeeld # 2: Klasse 10 B
Code:
tenthclass_sectionB = data.frame(roll_number = c(6:10), Name = c("Ria", "Justin", "Bon", "Tim", "joe"),
Marks = c(68, 98, 54, 68, 42), stringsAsFactors = FALSE)
print(tenthclass_sectionB)
Output:
Voorbeeld # 3: rbind () functie
Nu moeten we deze beide klassen samenvoegen tot één klasse. We zullen de functie rbind () hier gebruiken. De enige beperking bij het toevoegen van een nieuwe rij is dat we de nieuwe rijen in dezelfde structuur moeten brengen als het bestaande gegevensframe.
Code:
new_tenthclass = rbind(tenthclass_sectionA, tenthclass_sectionB)
print(new_tenthclass)
Output:
2. Kolom toevoegen
Overweeg nu een geval waarin we bloedgroepdetails van elke student in klasse 10 moeten toevoegen. We zullen er een nieuwe kolom voor toevoegen en deze de naam "Bloedgroep" geven.
Ons gegevensframe ziet er zo uit.
Code:
tenthclass = data.frame(roll_number = c(1:5), Name = c("John", "Sam", "Casey", "Ronald", "Mathew"),
Marks = c(77, 87, 45, 68, 95), stringsAsFactors = FALSE)
print(tenthclass)
Output:
Code:
tenthclass$Blood_group = c("O", "AB", "B+", "A+", "AB")
print(tenthclass)
Output:
Rij en kolom verwijderen uit gegevensframe
Om rij en kolom uit het gegevensframe te verwijderen, gebruiken we de volgende code-implementatie.
1. Kolom verwijderen
Code:
print(tenthclass)
Output:
Als we in dit gegevensframe de bloedgroepvariabele (kolom uiterst rechts) moeten verwijderen, geven we de onderstaande code door.
Code:
tenthclass$Blood_group = NULL
print(tenthclass)
Output:
Door het NULL-commando te omzeilen kunnen we de variabele direct uit ons dataframe verwijderen.
2. Rij verwijderen
Code:
print(tenthclass)
Output:
Overweeg nu een situatie waarin we geen tekens van John nodig hebben, dus moeten we de bovenste rij verwijderen.
Code:
tenthclass = tenthclass(-1, ) print(tenthclass)
Output:
Gegevens bijwerken in gegevensframe
Code:
print(tenthclass)
Output:
Laten we aannemen dat Sam 98 punten scoort, maar volgens onze gegevensframetekens 87 zijn. Dus we kunnen de onderstaande code doorgeven om het te corrigeren.
Code:
tenthclass$Marks(2) = 98
print(tenthclass)
Output:
Conclusie
Dataframes zijn een veel voorkomende vorm van de probleemstelling. Het is een lijst met de variabele van hetzelfde aantal rijen met unieke rij-ID's. Dit artikel helpt ons te weten hoe we een rij kunnen toevoegen, een kolom toevoegen, een rij verwijderen, een kolom uit het gegevensframe verwijderen en ook hoe we de gegevens in het gegevensframe kunnen bijwerken.
Aanbevolen artikelen
Dit is een gids voor gegevensframes in R. Hier bespreken we de verschillende stappen om gegevensframes te maken en hoe u gegevens uit gegevensframes in R. kunt extraheren. U kunt ook de volgende artikelen raadplegen voor meer informatie-
- Top 5 gegevenstypen in R
- Lijst met nuttige R-pakketten
- R CSV-bestanden
- R Programmafuncties - Belang
- Factor in R met voordelen