Multivariate regressie - Voorbeelden van multivariate regressie

Inhoudsopgave:

Anonim

Inleiding tot multivariate regressie

  • De term in multivariate betekent model met meer dan één variabele
  • Multivariate regressie is een onderdeel van multivariate statistieken.
  • Multivariate regressie is een techniek die wordt gebruikt om een ​​enkel regressiemodel te schatten wanneer er meer dan één uitkomstvariabele is.
  • Multivariate regressie gebruikte gewoonlijk een machine learning-algoritme dat een Supervised Learning-algoritme is.

Waarom werkt een enkel regressiemodel niet?

  • Zoals bekend wordt die regressieanalyse vooral gebruikt om de relatie tussen een afhankelijke en onafhankelijke variabele te onderzoeken.
  • In de echte wereld zijn er veel situaties waarin veel onafhankelijke variabelen invloed hebben op andere variabelen. Daarom moeten we naar andere opties gaan dan een enkel regressiemodel dat slechts één onafhankelijke variabele kan bevatten.

Wat is multivariate regressie?

  • Multivariate regressie helpt bij het meten van de hoek van meer dan één onafhankelijke variabele en meer dan één afhankelijke variabele. Het vindt de relatie tussen de variabelen (lineair gerelateerd).
  • Vroeger voorspelde het gedrag van de uitkomstvariabele en de associatie van voorspellende variabelen en hoe de voorspellende variabelen veranderen.
  • Het kan worden toegepast op vele praktische gebieden zoals politiek, economie, medisch, onderzoekswerken en veel verschillende soorten bedrijven.
  • Multivariate regressie is een eenvoudige uitbreiding van meervoudige regressie.
  • Meerdere regressie wordt gebruikt om de waarden van één variabele te voorspellen en uit te wisselen op basis van de collectieve waarde van meer dan één waarde van voorspellende variabelen.
  • Eerst zullen we een voorbeeld nemen om het gebruik van multivariate regressie te begrijpen, daarna zullen we de oplossing voor dat probleem zoeken.

Voorbeelden van multivariate regressie

  • Als E-commerce Company de gegevens van zijn klanten heeft verzameld, zoals Leeftijd, aankoopgeschiedenis van een klant, geslacht en bedrijf, willen de relatie tussen deze verschillende afhankelijke en onafhankelijke variabelen vinden.
  • Een sportschooltrainer heeft de gegevens van zijn cliënt verzameld die naar zijn sportschool komen en willen enkele zaken van de cliënt observeren die gezondheid zijn, eetgewoonten (welk soort productklant elke week consumeert), het gewicht van de cliënt. Dit wil een verband vinden tussen deze variabelen.

Zoals je in de bovenstaande twee voorbeelden hebt gezien dat er in beide situaties meer dan één variabele is, zijn sommige afhankelijk en sommige onafhankelijk, dus een enkele regressie is niet voldoende om dit soort gegevens te analyseren.

Hier is de multivariate regressie die in beeld komt.

1. Functieselectie -

De selectie van functies speelt de belangrijkste rol in multivariate regressie.

De functie vinden die nodig is om te bepalen welke variabele afhankelijk is van deze functie.

2. Normaliseren van functies -

Voor een betere analyse moeten functies worden geschaald om ze binnen een specifiek bereik te krijgen. We kunnen ook de waarde van elke functie wijzigen.

3. Selecteer Verliesfunctie en Hypothese -

De verliesfunctie berekent het verlies wanneer de hypothese de verkeerde waarde voorspelt.

En hypothese betekent voorspelde waarde van de kenmerkvariabele.

4. Stel hypotheseparameters in -

Stel de hypothese-parameter in die de verliesfunctie kan verminderen en kan voorspellen.

5. Minimaliseer de verliesfunctie-

Het verlies minimaliseren met behulp van een algoritme voor het minimaliseren van verliezen en het gebruiken via de dataset, wat kan helpen om de hypothese-parameters aan te passen. Zodra het verlies is geminimaliseerd, kan het worden gebruikt voor voorspelling.

Er zijn veel algoritmen die kunnen worden gebruikt om het verlies te verminderen, zoals gradiëntdaling.

6. Test de hypothesefunctie -

Controleer de hypothesefunctie hoe correct deze waarden voorspelt, test deze op testgegevens.

Stappen om archief Multivariate Regression te volgen

1) Importeer de benodigde gemeenschappelijke bibliotheken zoals numpy, panda's

2) Lees de dataset met behulp van de bibliotheek van de panda's

3) Zoals we hierboven hebben besproken, moeten we de gegevens normaliseren om betere resultaten te krijgen. Waarom normalisatie omdat elke functie een ander bereik van waarden heeft.

4) Maak een model dat regressie kan archiveren als u lineaire regressie gebruikt, gebruik dan een vergelijking

Y = mx + c

Waarin x invoer krijgt, is m een ​​slop-lijn, is c constant, is y de uitvoervariabele.

5) Train het model met behulp van hyperparameter. Begrijp de hyperparameter ingesteld volgens het model. Zoals leersnelheid, tijdvakken, iteraties.

6) Zoals hierboven besproken, hoe de hypothese een belangrijke rol speelt in de analyse, de hypothese controleert en de verlies / kosten-functie meet.

7) De verlies / kosten-functie helpt ons te meten hoe hypothesewaarde waar en nauwkeurig is.

8) Minimaliseer de verlies / kosten-functie helpt het model om de voorspelling te verbeteren.

9) De verliesvergelijking kan worden gedefinieerd als een som van het kwadraatverschil tussen de voorspelde waarde en de werkelijke waarde gedeeld door tweemaal de grootte van de gegevensset.

10) Gebruik de gradiëntdaling om de verlies- / kostenfunctie te minimaliseren, deze begint met een willekeurige waarde en vindt het punt waarvan de verliesfunctie het minst is.

Door het bovenstaande te volgen, kunnen we Multivariate regressie implementeren

Voordelen van multivariate regressie

  • De multivariate techniek maakt het mogelijk om een ​​relatie tussen variabelen of kenmerken te vinden
  • Het helpt om een ​​verband te vinden tussen onafhankelijke en afhankelijke variabelen.

Nadelen van multivariate regressie

  • Multivariate technieken zijn een beetje ingewikkeld en wiskundige berekeningen op hoog niveau
  • De output van het multivariate regressiemodel is niet gemakkelijk te interpreteren en soms omdat sommige output van verlies en fouten niet identiek zijn.
  • Het kan niet worden toegepast op een kleine gegevensset omdat de resultaten eenvoudiger zijn in grotere gegevenssets.

Conclusie - Multivariate regressie

  • Het belangrijkste doel om multivariate regressie te gebruiken, is wanneer er meer dan één variabelen beschikbaar zijn en in dat geval zal een enkele lineaire regressie niet werken.
  • Voornamelijk echte wereld heeft meerdere variabelen of functies wanneer meerdere variabelen / functies in het spel komen, multivariate regressie wordt gebruikt.

Aanbevolen artikelen

Dit is een gids voor de multivariate regressie. Hier bespreken we de introductie, voorbeelden van multivariate regressie samen met de voor- en nadelen. U kunt ook onze andere voorgestelde artikelen doornemen voor meer informatie -

  1. Regressie Formule
  2. Data Science Course in Londen
  3. SAS-exploitanten
  4. Data Science-technieken
  5. Variabelen in JavaScript
  6. Topverschillen van regressie versus classificatie