Inleiding tot onbewaakt machinaal leren

Heb je er ooit aan gedacht hoe een kind onderscheid kan maken tussen appels en sinaasappels als hij niet weet wat ze eigenlijk zijn, hoe ze smaken, maar op basis van kleur en grootte kan hij ze in twee groepen scheiden zonder enige voorafgaande informatie? Kunnen we dezelfde segmentatie verwachten als een kind van machines als we de informatie over kleur en maat krijgen? Laten we kijken hoe we dat kunnen doen! In dit onderwerp gaan we meer te weten komen over machinaal leren zonder toezicht.

"Machine learning" zoals de term suggereert, leren we machines om mensachtige taken uit te voeren en hoe leren mensen, van iemand of door observatie. Hetzelfde als mensen, de manier waarop de machine leert.

Machine learning kan in 3 delen worden verdeeld: -

  1. Leren onder toezicht
  2. Leren zonder toezicht
  3. Versterking leren

Soorten machine learning

Versterkingsleren is op agent gebaseerd leren, dat beloning en straf inhoudt bij acties die door een agent worden ondernomen. Het einddoel is om de totale beloning te maximaliseren in het proces van leren van de omgeving.

Wanneer u input-outputgegevens hebt, kortom, gelabelde gegevens, bijvoorbeeld gegeven lengte en gewicht om te bepalen of een persoon mannelijk of vrouwelijk is, kan dit worden beschouwd als een begeleide leertaak (van iemand in het geval van mensen).

Maar in veel realistische scenario's zijn deze gelabelde of geannoteerde gegevens niet altijd beschikbaar. Vaak worden we geconfronteerd met problemen bij het segmenteren van objecten op basis van hun eigenschappen die niet expliciet worden vermeld. Hoe dit probleem op te lossen? Nou, zonder toezicht leren is de oplossing.

Wikipedia zegt dat ongecontroleerd leren een soort zelfgeorganiseerd Hebbisch leren is dat helpt bij het vinden van eerder onbekende patronen in gegevensverzameling zonder reeds bestaande labels. Bij niet-gecontroleerd leren hebben we geen etiketinformatie, maar we willen toch inzichten krijgen in de gegevens op basis van de verschillende eigenschappen.

Soorten onbewaakt machinaal leren

Niet-begeleide leertaken kunnen grofweg worden onderverdeeld in 3 categorieën:

  1. Association rule mining
  2. clustering
  3. Aanbevelingssysteem

1. Associatieregelwinning

Wanneer we transactiegegevens voor iets hebben, kan dit voor verkochte producten zijn of enige transactiegegevens daarvoor, ik wil weten, is er een verborgen relatie tussen de koper en de producten of product tot product, zodat ik op de een of andere manier deze informatie kan benutten om mijn omzet te verhogen. Het extraheren van deze relaties is de kern van Association Rule Mining. We kunnen de AIS, SETM, Apriori, FP groei-algoritmen gebruiken voor het extraheren van relaties.

2. Clustering

Clustering kan worden gedaan met alle gegevens waar we niet over de klasse- of labelinformatie beschikken. We willen de gegevens zodanig groeperen dat de waarnemingen met vergelijkbare eigenschappen tot dezelfde cluster / groep behoren en dat de afstand tussen de clusters maximaal moet zijn. Terwijl de intra-cluster afstand minimaal moet zijn. We kunnen de gegevens van de kiezer clusteren om de mening over de overheid te achterhalen, of clusterproducten, op basis van hun functies en gebruik. Segmenteer populatie op basis van inkomenskenmerken of gebruik clustering in verkoop en marketing.

We kunnen K-middelen, K-middelen ++, K-Medoids, Fuzzy C-middelen (FCM) gebruiken,

Verwachting-maximalisatie (EM), Agglomeratieve clustering, DBSCAN, soorten hiërarchische clustering als enkele koppeling, volledige koppeling, mediane koppeling, Ward's methode-algoritmen voor clustering.

3. Aanbevelingssysteem

Aanbevelingssysteem is eigenlijk een uitbreiding van Association rule mining in de zin, in ARM halen we relaties uit en in Aanbevelingssysteem gebruiken we deze relaties om iets aan te bevelen dat hogere acceptatiekansen heeft voor de eindgebruiker. Aanbevelingssystemen zijn populair geworden nadat Netflix in 2009 een hoofdprijs van US $ 1.000.000 heeft aangekondigd.

Recommendation Systems werkt op transactiegegevens, of het nu gaat om financiële transacties, e-commerce of supermarkttransacties. Tegenwoordig lokken gigantische spelers in de e-commerce-industrie klanten door een aangepaste aanbeveling voor elke gebruiker te maken op basis van hun eerdere aankoopgeschiedenis en vergelijkbare aankoopgegevens van andere gebruikers.

Methoden om aanbevelingssystemen te ontwikkelen kunnen grofweg worden onderverdeeld in Collaborative filtering en Content-Based filtering. In Collaborative filtering hebben we weer user-user Collaborative filtering en Item-Item Collaborative filtering die geheugengebaseerde benaderingen zijn en Matrix-factorisatie en Singular Value Decomposition (SVD) zijn modelgebaseerde benaderingen.

Toepassingen van ongecontroleerd leren

Omdat de gegevens van de wereld elke dag enorm toenemen, heeft leren zonder toezicht veel toepassingen. We maken altijd gegevens met behulp van sociale mediaplatforms of bepaalde video-inhoud op YouTube en vaak doen we dat niet opzettelijk. Al deze gegevens zijn ongestructureerd en labelen voor begeleide leertaken zal vermoeiend en duur zijn.

Hierna volgen enkele coole toepassingen van machinaal leren zonder toezicht.

  1. Kruidenier of e-commerce winkel / marktplaats: extraheer Associatieregels van transactiegegevens van klanten en aanbevelingen voor consumenten om producten te kopen.
  2. Social Media Platform: haal relaties uit met verschillende gebruikers om producten of diensten aan te bevelen. Beveel nieuwe mensen aan voor social connect.
  3. Diensten: aanbevelingen van reisservices, een aanbeveling van huurwoningen of matchmaking-diensten.
  4. Bankieren: klanten clusteren op basis van hun financiële transacties. Cluster frauduleuze transactie voor fraudedetectie.
  5. Politiek: meningen van clusters over de kansen op winst voor een bepaalde partij.
  6. Datavisualisatie: met clustering en t-verdeelde Stochastic Neighbor Embedding (t-SNE) kunnen we hoogdimensionale gegevens visualiseren. Dit kan ook worden gebruikt voor vermindering van de dimensionaliteit.
  7. Entertainment: aanbevelingen voor films, muziek, zoals Netflix en Amazon doen.
  8. Beeldsegmentatie: Cluster afbeeldingen delen op basis van dichtstbijzijnde pixelwaarden.
  9. Inhoud: gepersonaliseerde kranten, aanbevelingen van webpagina's, e-learningtoepassingen en e-mailfilters.
  10. Structurele ontdekking: met clustering kunnen we elke verborgen structuur in de gegevens ontdekken Cluster Twitter-gegevens voor sentimentanalyse.

Conclusie

Machinaal leren zonder toezicht is niet te kwantificeerbaar, maar kan veel problemen oplossen waarbij bewaakte algoritmen falen. Er zijn veel toepassingen voor niet-gecontroleerd leren in veel domeinen waar we ongestructureerde en niet-geëtiketteerde gegevens hebben. We kunnen zonder toezicht leertechnieken gebruiken om onze machines te leren beter te doen dan wij. In de afgelopen jaren hebben machines de mensheid overtroffen op het gebied van taken die al eeuwen door mensen worden opgelost. Ik hoop dat je met dit artikel hebt begrepen wat is en hoe technieken voor machinaal leren zonder toezicht kunnen worden gebruikt om echte problemen op te lossen.

Aanbevolen artikelen

Dit is een handleiding voor machinaal leren zonder toezicht. Hier bespreken we de soorten machinaal leren en soorten onbewaakt machinaal leren samen met zijn toepassingen. U kunt ook de volgende artikelen bekijken voor meer informatie -

  1. Machine Learning-algoritmen
  2. Wat is machinaal leren?
  3. Inleiding tot machinaal leren
  4. Hulpmiddelen voor machine leren
  5. Clustering in machine learning
  6. Machine leren van hyperparameter
  7. Hiërarchisch clusteringalgoritme
  8. Hiërarchische clustering | Agglomerative & Divisive Clustering
  9. Top 8 fasen van levenscyclus van machine learning

Categorie: