Overzicht van Two Way ANOVA in R
Twee-weg ANOVA (Analysis of Variance) helpt ons de relatie te begrijpen tussen één continu afhankelijke variabele en twee categorische onafhankelijke variabelen. In dit onderwerp gaan we meer te weten over Two Way ANOVA in R.
Hieronder vindt u de hypothese van interesse onder ANOVA in twee richtingen
- H₀: Noem het het belangrijkste effect, dat de eerste factor is die afhankelijk is van de continue variabele
- H₀: het hoofdeffect gaat ook over het effect op de tweede variabele op de afhankelijke continue variabele.
- H₀: Interactie is het gecombineerde effect van zowel de eerste, tweede factorvariabele op de afhankelijke variabele
Hieronder staan de normen waaraan een ANOVA in twee richtingen moet voldoen.
- Observaties moeten onafhankelijk zijn
- Waarnemingen moeten normaal worden verspreid.
- Er moet een gelijke variantie zijn in de waarnemingen
- Geen uitschieters in ontwerp
- Fouten moeten onafhankelijk zijn.
Notitie
We moeten onze gegevens transformeren als normaliteit en gelijke variantie worden geschonden.
Voorbeeld van Two Way ANOVA in R
Laten we een ANOVA-test in één richting uitvoeren op de gegevensset voor kankerniveaus die 48 rijen en 3 gegevensvariabelen bevat:
Genomen tijd: overlevingstijd van een dier
Verschillende niveaus van kanker 1 - 3
Behandeling: Behandelingen gebruikt van 1-3
Voordat we testen, hebben we de volgende gegevens nodig.
- Gegevens importeren
- Verwijder onnodige variabelen
- Converteer variabelen (niveaus van kanker) naar geordend niveau.
Hieronder vindt u de gegevensset.
Opmerkingen: 48
Variabelen: 3
tijd om te overleven 0, 31, 0, 45, 0, 46, 0, 43, 0, 36, 0, 29, 0, 40, 0, 23, 0, 22, 0 …
kankerniveaus 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 1, 1, 1, 1, 2, 2, 2 …
Behandeling A, A, A, A, A, A, A, A, A, A, A, A, B, B, B, B, B, B, …
Doelstellingen
- H₀: geen verandering in gemiddelde overlevingstijd tussen groep
- H₀: overlevingstijd is verschillend voor ten minste één groep.
Stappen
- Controleer de kankerniveaus. We kunnen drie karakterwaarden zien omdat we ze omzetten in factoren met een mutatief werkwoord.
levels(df$cancerlevels)
output: (1) "1" "2" "3"
- Bereken zowel gemiddelde als standaarddeviatie
df % > %
group_by(cancerlevels) % > %
summarise(
count_ cancerlevels = n(),
mean_time = mean(time, na.rm = TRUE),
sd_time = sd(time, na.rm = TRUE)
)
Output:
Een stukje: 3 x 4
kankerniveaus count_cancerlevels mean_time sd_time
1 1 16 0, 617500 0, 20942779
2 2 16 0.544375 0.28936641
3 3 16 0.276250 0.06227627
- In stap drie kunt u grafisch controleren of er een verschil is tussen de verdelingen. Merk op dat u de jittered dot opneemt.
- Voer de test uit met het commando AOV.
aov(formula, data)
Arguments:
- formula: The equation you want to estimate
- data: The dataset used
Syntaxis:
y ~ X1 + X2 + … + Xn (X1 + X2 + … verwijst naar de onafhankelijke variabelen)
y ~. Gebruik alle resterende variabelen als onafhankelijke variabelen
Zorg ervoor dat u het model opslaat en de samenvatting afdrukt.
Code
- aov (time ~ cancerlevels, data = df): Voer de ANOVA-test uit met de volgende formule
- samenvatting (anova_one_way): druk de samenvatting van de test af
Df Sum Sq Gemiddelde Sq F-waarde Pr (> F)
Kankerlevels 2 1.033 0.5165 11.79 7.66e-05 ***
Restanten 45 1.972 0.0438
-
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0, 1 '' 1
De p-waarde is lager dan de drempel 0, 05. Het statistische verschil wordt in het bovenstaande geval aangeduid met '*'.
One Way Test naar Two Way Anova in R
Laten we eens kijken hoe de eenrichtingsproef kan worden uitgebreid tot tweewegs ANOVA. De test lijkt op ANOVA in één richting, maar de formule verschilt en voegt een andere groepsvariabele toe aan de formule.
y = x1 + x2
- H0 : de gemiddelden zijn gelijk voor beide variabelen (factorvariabelen)
- H3 : de gemiddelden zijn verschillend voor beide variabelen
U voegt traktatievariabelen toe aan ons model. Deze variabele geeft de behandeling aan die aan de patiënt is gegeven. U bent geïnteresseerd om te zien of er een statistische afhankelijkheid is tussen de niveaus van kanker en de behandeling die aan de patiënt wordt gegeven.
We passen onze code aan door een traktatie toe te voegen met de andere onafhankelijke variabele.
Df Sum Sq Gemiddelde Sq F-waarde Pr (> F)
Kankerniveaus 2 1, 0330 0, 5165 20, 64 5, 7e-07 ***
Behandeling 3 0.9212 0.3071 12.27 6.7e-06 ***
Residuen 42 1.0509 0.0250
Zowel kankerniveaus als behandeling zijn statistisch verschillend van 0. Hierdoor kunnen we de NULL-hypothese verwerpen. Bevestig ook dat het veranderen van de behandeling of het type kanker de overlevingstijd beïnvloedt.
Test
One-way ANOVA: H3- Gemiddeld is verschillend voor ten minste één groep
Two-way ANOVA: H3- Gemiddeld is verschillend voor beide groepen.
Verschil tussen een manier en twee richtingen ANOVA
Verschillen tussen One-way ANOVA en two-way ANOVA
Eenrichtings-ANOVA | Tweerichtings ANOVA |
Ontworpen om gelijkheidstesten tussen 3 of meer middelen mogelijk te maken | Ontworpen om de onderlinge relatie van twee onafhankelijke variabelen op een afhankelijke variabele te beoordelen. |
Betreft één onafhankelijke variabele | Betreft twee onafhankelijke variabelen |
Geanalyseerd in 3 of meer categorische groepen. | Vergelijkt meerdere groepen van twee factoren |
Moet voldoen aan twee principes - replicatie en randomisatie | Moet voldoen aan drie principes die replicatie, randomisatie en lokale controle zijn. |
Voordelen van Two Way ANOVA
- In het bovenstaande voorbeeld helpen de leeftijd en het geslacht in ons voorbeeld - om foutafwijkingen te verminderen, waardoor het ontwerp efficiënter wordt.
- Met Two-Way ANOVA kunnen we het effect van twee factoren tegelijkertijd testen.
Toepassingen van ANOVA
- Vergelijking van de kilometerstand van verschillende voertuigen, brandstof en wegtypen.
- De impact van temperatuur, druk of chemische concentratie op sommige chemische reacties leren kennen (krachtreactoren, chemische fabrieken, enz.)
- Impact van verschillende katalysatoren op chemische reactiesnelheden
- Inzicht in de impact van commercials en verschillende aantallen klantreacties.
- Impact van prestaties, kwaliteit en snelheid in de biologie (proces gebaseerd op het aantal cellen waarin ze worden verdeeld)
Aanbevolen artikelen
Dit is een gids voor Two Way ANOVA in R. Hier bespreken we de voorbeelden, doelstellingen, stappen en het verschil tussen One Way en Two Way ANOVA. U kunt ook de volgende artikelen bekijken voor meer informatie -
- ANOVA in R
- Resultaten interpreteren met ANOVA-test
- Regressie versus ANOVA
- GLM in R