Inleiding tot polynomiale regressie

Regressie wordt gedefinieerd als de methode om de relatie tussen de onafhankelijke en afhankelijke variabelen te vinden om de uitkomst te voorspellen. Het eerste polynoomregressiemodel werd in 1815 gebruikt door Gergonne. Het wordt gebruikt om de best passende lijn te vinden met behulp van de regressielijn voor het voorspellen van de resultaten. Er zijn veel soorten regressietechnieken, polynoomregressie is er een van. Voordat u dit begrijpt, is het raadzaam om de juiste kennis van lineaire regressie te hebben, dus het zal gemakkelijk zijn om de verschillen tussen hen te markeren.

Waarom polynomiale regressie?

  • Dit is een van de regressietechnieken die door de professionals wordt gebruikt om de uitkomst te voorspellen. Het wordt gedefinieerd als de relatie tussen de onafhankelijke en afhankelijke variabelen wanneer de afhankelijke variabele gerelateerd is aan de onafhankelijke variabele met een nde graad. Het vereist niet dat de relatie tussen afhankelijke en onafhankelijke variabelen lineair is, dus als de lijn een curve is, kan deze een polynoomterm hebben.
  • Het belangrijkste verschil tussen lineaire en polynomiale regressie is dat lineaire regressie vereist dat de afhankelijke en onafhankelijke variabelen lineair gerelateerd zijn, terwijl dit beter past in de lijn als we een hogere graad opnemen voor de onafhankelijke variabele term in de vergelijking. De vergelijking van de polynoomregressie met een nde graad kan worden geschreven als:

Y = b0 + a1x + a2x 2 + a3x 3 +…. ANX n

  • Als we hogere graden toevoegen, zoals kwadratisch, dan verandert de lijn in een curve die beter past bij de gegevens. Over het algemeen wordt het gebruikt wanneer de punten in de gegevensverzameling verspreid zijn en het lineaire model het resultaat niet duidelijk kan beschrijven. We moeten Overfitting en Underfitting altijd in de gaten houden terwijl we deze graden ten opzichte van de vergelijking overwegen.
  • Het is beter om de mate te overwegen die door alle gegevenspunten gaat, maar soms kan een hogere graad zoals 10 of 20 door alle gegevenspunten gaan en de fout verminderen, maar het vangt ook de ruis op van de gegevens die over het model passen en dit kan worden voorkomen door meer voorbeelden aan de trainingsdataset toe te voegen. Het is dus altijd raadzaam om een ​​optimale graad te kiezen die bij het model past.

Er zijn twee technieken die worden gebruikt om de mate van vergelijking te bepalen:

  • Voorwaartse selectie: het is de methode om de graad te verhogen totdat deze significant genoeg is om het model te definiëren.
  • Achterwaartse selectie: het is de methode om de graad te verlagen totdat deze significant genoeg is om het model te definiëren.

Procedure om polynomiale regressie toe te passen

Hieronder vindt u de onderstaande stappen of procedure om polynoomregressie toe te passen op een gegevensset:

Stap 1: Importeer de respectieve gegevensset op elk platform (R of Python) en installeer de vereiste pakketten die vereist zijn voor het toepassen van het model.

Stap 2: Verdeel de dataset in trainings- en testsets zodat we het algoritme op de trainingsdataset kunnen toepassen en testen met behulp van de testdataset.

Stap 3: Pas verkennende gegevensanalysemethoden toe om de achtergrond van de gegevens te bestuderen, zoals gemiddelde, mediaan, modus, eerste kwartiel, tweede kwartiel, enz.

Stap 4: Pas het lineaire regressie-algoritme toe op de gegevensset en bestudeer het model.

Stap 5: Pas het Polynomiale regressie-algoritme toe op de gegevensset en bestudeer het model om de resultaten te vergelijken, hetzij RMSE of R square tussen lineaire regressie en polynomiale regressie.

Stap 6: Visualiseer en voorspel zowel de resultaten van lineaire en polynomiale regressie en identificeer welk model de dataset met betere resultaten voorspelt.

Polynomiale regressietoepassingen

  • Het wordt in veel experimentele procedures gebruikt om de uitkomst te produceren met behulp van deze vergelijking.
  • Het biedt een goed gedefinieerde relatie tussen de onafhankelijke en afhankelijke variabelen.
  • Het wordt gebruikt om de isotopen van de sedimenten te bestuderen.
  • Het wordt gebruikt om de opkomst van verschillende ziekten binnen elke populatie te bestuderen.
  • Het wordt gebruikt om het genereren van elke synthese te bestuderen.

Kenmerken van polynomiale regressie

  • Het is een type niet-lineaire regressiemethode die ons de relatie vertelt tussen de onafhankelijke en afhankelijke variabele wanneer de afhankelijke variabele gerelateerd is aan de onafhankelijke variabele van de nde graad.
  • De best passende lijn wordt bepaald door de mate van de polynoomregressievergelijking.
  • Het model afgeleid van de polynoomregressie wordt beïnvloed door de uitbijters, dus het is altijd beter om uitbijters te behandelen voordat het algoritme op de gegevensset wordt toegepast.
  • De functie Polynomialfeature () wordt omgezet in een matrixkenmerk afhankelijk van de mate van vergelijking.
  • De aard van de curve kan worden bestudeerd of gevisualiseerd met behulp van een eenvoudige spreidingsplot die u een beter idee geeft van de lineariteitsrelatie tussen de variabelen en dienovereenkomstig beslist.

Conclusie

Polynomiale regressie wordt in veel organisaties gebruikt wanneer ze een niet-lineaire relatie tussen de onafhankelijke en afhankelijke variabelen identificeren. Het is een van de moeilijke regressietechnieken in vergelijking met andere regressiemethoden, dus met diepgaande kennis over de aanpak en het algoritme kunt u betere resultaten behalen.

Aanbevolen artikelen

Dit is een gids voor een polynomiale regressie. Hier bespreken we de functies en het gebruik van Polynomiale regressie. U kunt ook onze andere voorgestelde artikelen doornemen voor meer informatie–

  1. SVM-algoritme
  2. Kernelmethoden
  3. LIJNSCH Excel-functie
  4. Machine Learning-algoritmen
  5. Lineaire regressie versus logistieke regressie | Topverschillen

Categorie: