Inleiding tot datamining

Hier in dit artikel gaan we meer te weten komen over de inleiding tot datamining, aangezien mensen al eeuwenlang op aarde delven om allerlei waardevolle materialen te krijgen. Soms worden tijdens de mijnbouw dingen uit de grond ontdekt die niemand verwachtte te vinden. In 1898, bijvoorbeeld, tijdens de opgraving van een graf om mummies te vinden in Saqqara, Egypte, werd een houten artefact gevonden dat precies op een vliegtuig leek. Het werd gedateerd in 200 voor Christus, ongeveer 2200 jaar geleden! Maar welke mogelijke informatie kunnen we uit een grote reeks gegevens halen? En zelfs als we het gaan minen, zijn er dan kansen om onverwachte resultaten uit de gegevensset te krijgen? Laten we daarvoor eens kijken naar wat Data Mining precies is.

Wat is datamining?

  • Het is in feite het extraheren van vitale informatie / kennis uit een grote reeks gegevens.
  • Beschouw data als een groot grond / rotsachtig oppervlak. We weten niet wat erin zit, we weten niet of er iets nuttigs onder de rotsen zit.
  • In deze inleiding tot datamining zijn we op zoek naar verborgen informatie, maar zonder enig idee over welk type informatie we willen vinden en wat we van plan zijn om het eenmalig te gebruiken, vinden we het.
  • Net als in het concept traditionele mijnbouw, zijn er in datamining ook verschillende technieken en tools, die variëren naargelang het type data dat we minen.

Voorbeeld van datamining

We hebben de introductie tot datamining in het bovenstaande gedeelte geleerd en gaan nu verder met de voorbeelden van datamining, die hieronder worden vermeld:

  • Er is dus een mobiele netwerkoperator. Ze raadplegen een Dataminer om in de oproeprecords van de operator te graven. Er worden geen specifieke doelen aan de Data Miner gegeven.
  • Een kwantitatief doel van het vinden van ten minste 2 nieuwe patronen in een maand wordt gegeven.
  • Terwijl de dataminer de gegevens begint in te graven, vindt hij een patroon dat er op woensdag minder internationale gesprekken zijn in vergelijking met andere dagen.
  • Deze informatie wordt gedeeld met het management en zij komen met het plan om de internationale beltarieven op woensdag te verlagen en een campagne te starten.
  • De beltarieven stijgen, klanten zijn blij met de lage belprijs, meer klanten melden zich aan en het bedrijf verdient meer! Win-win situatie!

Met het bovenstaande voorbeeld in gedachten, laten we nu kijken naar de verschillende stappen die betrokken zijn bij datamining.

Stappen betrokken bij datamining

We hebben de introductie tot datamining in de bovenstaande sectie geleerd en gaan nu verder met de stappen die betrokken zijn bij datamining, die hieronder worden vermeld:

  • Zakelijk begrip

In deze Inleiding tot datamining begrijpen we elk aspect van de bedrijfsdoelstellingen en -behoeften. De huidige situatie wordt beoordeeld door de middelen, aannames en andere belangrijke factoren te vinden. Dienovereenkomstig een goede inleiding tot het dataminingplan opstellen om zowel zakelijke als dataminingdoelen te bereiken.

  • Gegevens begrijpen

In eerste instantie worden de gegevens verzameld uit alle beschikbare bronnen. Vervolgens kiezen we de beste gegevensset waaruit we de gegevens kunnen extraheren die voordeliger kunnen zijn.

  • Data voorbereiding

Nadat de gegevensset is geïdentificeerd, wordt deze geselecteerd, opgeschoond, geconstrueerd en in de gewenste vorm geformatteerd.

  • Gegevensmodellering

Het is een proces van het hermodelleren van de gegeven gegevens volgens de behoefte van de gebruiker. een of meer modellen kunnen worden gemaakt op basis van de voorbereide gegevensset en ten slotte moeten de modellen zorgvuldig worden beoordeeld waarbij belanghebbenden worden betrokken om ervoor te zorgen dat gecreëerde modellen voldoen aan bedrijfsinitiatieven.

  • evaluatie

Dit is een van de meest noodzakelijke processen in datamining. Het omvat het doornemen van elk aspect van het proces om te controleren op mogelijke fouten of gegevenslekken in het proces. Ook kunnen nieuwe bedrijfsvereisten worden gesteld vanwege de nieuwe ontdekte patronen.

  • Deployment

Het betekent eenvoudigweg de kennis zo presenteren dat de stakeholders deze kunnen gebruiken wanneer ze die willen. In ons bovenstaande voorbeeld werd vastgesteld dat internationale telefoongesprekken minder waren op woensdag, dus deze informatie werd gepresenteerd aan de belanghebbenden die op hun beurt deze informatie in hun voordeel gebruikten en hun winst verhoogden.

Technieken die worden gebruikt bij datamining

In de bovenstaande sectie hebben we geleerd over de introductie tot datamining nu gaan we verder met de technieken die worden gebruikt in datamining die hieronder worden vermeld:

  • Clusteranalyse

Clusteranalyse maakt het mogelijk om een ​​bepaalde gebruikersgroep te identificeren op basis van algemene kenmerken in een database. Deze functies kunnen leeftijd, geografische locatie, opleidingsniveau enzovoort zijn.

  • Onregelmatigheidsdetectie

Het wordt gebruikt om te bepalen wanneer iets merkbaar anders is dan het reguliere patroon. Het wordt gebruikt om database-inconsistenties of anomalieën bij de bron te elimineren.

  • Regressie analyse

Deze techniek wordt gebruikt om voorspellingen te doen op basis van relaties binnen de gegevensset. Men kan bijvoorbeeld de voorraadkoers van een bepaald product voorspellen door de koers in het verleden te analyseren en ook rekening te houden met de verschillende factoren die de voorraadkoers bepalen. Of zoals hieronder weergegeven, als we de gegevens hebben over de lengte en het gewicht van verschillende personen, kunnen we, op basis van lengte of gewicht, de andere waarde bepalen.

  • Classificatie

Dit gaat over de dingen die labels hebben. Merk op dat bij clusterdetectie de dingen geen label hadden en door datamining moesten we labelen en in clusters vormen, maar in classificatie is er informatie die gemakkelijk kan worden geclassificeerd met behulp van een algoritme. Een voorbeeld zijn e-mail spamfilters. Het spamfilter wordt voorzien van zowel relevante als spamberichten (trainingsgegevens). De verschillen tussen beide worden geïdentificeerd waardoor het toekomstige e-mails correct kan classificeren.

  • Associatief leren

Het wordt gebruikt om te analyseren welke dingen samen voorkomen, in paren of grotere groepen. Bijvoorbeeld, mensen die de neiging hebben om citroenen te kopen, ook sinaasappels kopen, mensen die de neiging hebben om brood te kopen, ook melk kopen enzovoort. Dus de aankopen die door alle klanten zijn gedaan, worden geanalyseerd en de dingen die samen gebeuren, worden dicht bij elkaar geplaatst om de verkoop te verhogen. Melk wordt dus dicht bij brood geplaatst, citroenen worden naast sinaasappels geplaatst, enzovoort.

Is datamining ethisch?

Dus ik ben van plan een weekendtrip naar Goa te maken met een vriend, ik zoek op internet naar goede plaatsen om te bezoeken in Goa. De volgende keer dat ik internet open, vind ik advertenties over verschillende hotels in Goa om te verblijven.

  • Goed ding?

Ja, het internet heeft me geholpen mijn reis te vereenvoudigen. Immers, als ik besluit om Goa te bezoeken, zou ik ergens moeten slapen en een advertentie met een hotel is veel nuttiger dan een advertentie met willekeurige kleding om te kopen.

  • Iets slechts?

Ja! Waarom zou een dataminingbedrijf dat ik nog nooit eerder heb gehoord, weten waar ik op vakantie ga. Wat als ik niemand over deze reis heb verteld, maar hier weet internet opeens dat ik daarheen ga. De waarheid is dat het bedrijfsmodel van het dataminingbedrijf hiervan afhankelijk is. Ze verzamelen deze gegevens via cookies en scripts en verkopen ze vervolgens aan adverteerders die op hun beurt iets anders proberen te verkopen (in dit geval een hotelkamer).

Dus het kan goed of slecht zijn, afhankelijk van hoe we ernaar kijken. Ook kunnen we de cookies altijd uitschakelen of incognito gaan in het bovenstaande geval. Hoe dan ook, één ding is zeker. Datamining is er om te blijven.

Aanbevolen artikelen

Dit is een gids geweest voor Inleiding tot datamining. Hier bespreken we de betekenis, technieken en stappen die betrokken zijn bij de inleiding tot datamining met een voorbeeld om beter te begrijpen. U kunt ook de volgende artikelen bekijken voor meer informatie -

  1. Sollicitatievragen voor Data Mining
  2. Voorspellende analyse versus datamining
  3. Introductie tot Data Science
  4. Wat is regressieanalyse?

Categorie: