Uitbijtersformule (inhoudsopgave)

  • Uitbijtersformule
  • Voorbeelden van uitbijtersformule (met Excel-sjabloon)

Uitbijtersformule

In statistieken zijn uitschieters de twee extreem ver verwijderde ongebruikelijke punten in de gegeven gegevenssets. De extreem hoge waarde en extreem lage waarden zijn de uitbijterwaarden van een gegevensset. Dit is erg handig bij het vinden van een fout of fout die zich heeft voorgedaan. Zoals de naam al zegt, zijn uitbijters waarden die buiten de rest van de waarden in de gegevensset lagen. Overweeg bijvoorbeeld ingenieursstudenten en stel je voor dat ze dwergen in hun klas hadden. Dus dwergen zijn de mensen die extreem laag in lengte zijn in vergelijking met andere mensen met een normale lengte. Dus dit is de uitbijterwaarde in deze klasse. Uitschieterwaarden kunnen worden berekend met de Tukey-methode.

De formule voor uitbijters -

Lower Outlier = Q1 – (1.5 * IQR)
Higher Outlier= Q3 + (1.5 * IQR)

Voorbeelden van uitbijtersformule (met Excel-sjabloon)

Laten we een voorbeeld nemen om de berekening van de Outliers-formule beter te begrijpen.

U kunt deze sjabloon voor uitschieters hier downloaden - sjabloon voor uitschieters

Uitbijtersformule - Voorbeeld # 1

Overweeg de volgende gegevensset en bereken de uitbijters voor gegevensset.

Gegevensset = 5, 2, 7, 98, 309, 45, 34, 6, 56, 89, 23

Oplopende volgorde van gegevensset:

Mediaan van oplopende ordergegevensset wordt berekend als:

In deze gegevensset is het totale aantal gegevens 11. Dus n = 11. Mediaan = 11 + 1/2 = 12/2 = 6. De waarde die in deze gegevensset op de zesde positie staat, is dus de mediaan.

Dus Mediane waarde = 34.

Verdeel de gegevensset in 2 helften met behulp van de mediaan.

Mediaan van gegevensset onderste helft en bovenste helft wordt berekend als:

  • Als we in de onderste helft 2, 5, 6, 7, 23 de mediaan vinden zoals we die in stap 2 hebben gevonden, is de mediaan 6. Dus Q1 = 6.
  • Als we in de bovenste helft 45, 56, 89, 98.309 de mediaan vinden zoals we die in stap 2 hebben gevonden, is de mediaanwaarde 89. Dus Q3 = 89.

IQR wordt berekend met behulp van de onderstaande formule

IQR = Q3 - Q1

  • IQR = 89-6
  • IQR = 83

Lagere uitbijter wordt berekend met behulp van de onderstaande formule

Lagere uitbijter = Q1 - (1.5 * IQR)

  • Lagere uitbijter = 6 - (1.5 * 83)
  • Lagere uitbijter = -118.5

Hogere uitbijter wordt berekend met behulp van de onderstaande formule

Hogere uitbijter = Q3 + (1.5 * IQR)

  • Hogere uitbijter = 89 + (1.5 * 83)
  • Hogere uitbijter = 213, 5

Haal deze waarden nu op in de gegevensset -118.5, 2, 5, 6, 7, 23, 34, 45, 56, 89, 98, 213.5, 309. Waarden die onder de waarde van de onderste zijde vallen en boven in de hogere zijde zijn de uitbijterwaarde. Voor deze gegevensset is 309 de uitbijter.

Uitbijtersformule - Voorbeeld # 2

Overweeg de volgende gegevensset en bereken de uitbijters voor gegevensset.

Gegevensset = 45, 21, 34, 90, 109.

Oplopende volgorde van gegevensset:

Mediaan van oplopende ordergegevensset wordt berekend als:

In deze gegevensset is het totale aantal gegevens 5. Dus n = 5. Mediaan = 5 + 1/2 = 6/2 = 3. Daarom is de waarde die in deze gegevensset op de 3e positie staat de mediaan.

Dus Mediane waarde = 45.

Verdeel de gegevensset in 2 helften met behulp van de mediaan.

Mediaan van gegevensset onderste helft en bovenste helft wordt berekend als:

  • Q1 = 27, 5
  • Q3 = 89

IQR wordt berekend met behulp van de onderstaande formule

IQR = Q3 - Q1

  • IQR = 99, 5 - 27, 5
  • IQR = 72

Lagere uitbijter wordt berekend met behulp van de onderstaande formule

Lagere uitbijter = Q1 - (1.5 * IQR)

  • Lagere uitbijter = 27, 5 - (1, 5 * 72)
  • Lagere uitbijter = -80, 5

Hogere uitbijter wordt berekend met behulp van de onderstaande formule

Hogere uitbijter = Q3 + (1.5 * IQR)

  • Hogere uitbijter = 99, 5 + (1, 5 * 72)
  • Hogere uitbijter = 207, 5

Uitleg

Stap 1: Rangschik alle waarden in de gegeven gegevensset in oplopende volgorde.

Stap 2: zoek de mediaanwaarde voor de gegevens die zijn gesorteerd. Mediaan kan worden gevonden met behulp van de volgende formule. De volgende berekening geeft u eenvoudig de positie van de mediaanwaarde die zich in de ingestelde datum bevindt.

Mediaan = (n + 1) / 2

Waarbij n het totale aantal beschikbare gegevens in de gegevensset is.

Stap 3: Zoek de lagere kwartielwaarde Q1 uit de gegevensset. Om dit te vinden, splitst u de gegevensset met behulp van de mediaanwaarde in twee helften. Zoek uit de onderste reeks waarden de mediaan voor die onderste reeks, die de Q1-waarde is.

Stap 4: Zoek de bovenste kwartielwaarde Q3 uit de gegevensset. Het is precies zoals de bovenstaande stap. In plaats van de onderste helft, moeten we dezelfde procedure volgen als de bovenste reeks waarden.

Stap 5: Zoek de IQR-waarde voor het interkwartielbereik. De Q1-waarde van Q3 aftrekken.

IQR = Q3-Q1

Stap 6: Vind de Inner Extreme-waarde. Een uiteinde dat buiten de onderkant valt en ook als een kleine uitbijter kan worden genoemd. Vermenigvuldig de IQR-waarde met 1, 5 en trek deze waarde af van Q1 voor het Inner Lower extreme.

Lagere uitbijter = Q1 - (1.5 * IQR)

Stap 7: Vind de Outer Extreme-waarde. Een uiteinde dat buiten de hogere kant valt en ook een grote uitbijter kan worden genoemd. Vermenigvuldig de IQR-waarde met 1, 5 en som deze waarde op met Q3 voor het extreme uiterste.

Hogere uitbijter = Q3 + (1.5 * IQR)

Stap 8: Waarden die buiten deze uitersten vallen, zijn de uitbijterwaarden voor de gegeven gegevensset.

Relevantie en gebruik van de formule van uitschieters

Uitbijters zijn erg belangrijk bij elk probleem met data-analyse. Outlier vertoont inconsistentie in elke gegevensset omdat deze wordt gedefinieerd als de ongewone verre waarden in de gegevensset van de ene naar de andere. Dit is erg handig bij het vinden van eventuele fouten in de gegevensset. Omdat wanneer u een fout in de gegevensset plaatst, dit van invloed is op het gemiddelde en de mediaan en daarom grote afwijkingen in het resultaat kan krijgen als uitbijters in de gegevensset voorkomen. Daarom is het essentieel om uitbijters uit de gegevensverzameling te vinden om ernstige problemen bij de statistische analyse te voorkomen.

Aanbevolen artikelen

Dit is een leidraad geweest voor de Outliers-formule. Hier bespreken we hoe u uitbijters kunt berekenen, samen met praktische voorbeelden en een downloadbare Excel-sjabloon. U kunt ook de volgende artikelen bekijken voor meer informatie -

  1. Handleiding voor middenklasse formule
  2. Voorbeelden van salarisformule
  3. Calculator voor DPMO-formule
  4. Hoe T-verdeling te berekenen?
  5. Kwartielafwijkingsformule | Voorbeelden