Verschil tussen data science en datamining
Datamining gaat over het vinden van de trends in een dataset. En deze trends gebruiken om toekomstige patronen te identificeren. Het is een belangrijke stap in het kennisontdekkingsproces. Het omvat vaak het analyseren van de enorme hoeveelheid historische gegevens die eerder werden genegeerd. Data Science is een vakgebied dat alles omvat van Big Data Analytics, Data Mining, Predictive Modelling, Data Visualization, Mathematics en Statistics. Data Science is het vierde paradigma van Science genoemd. (de andere drie zijn theoretisch, empirisch en computationeel). Academia doet vaak exclusief onderzoek in Data Science.
Historisch perspectief
Voordat we naar de technische beschrijvingen gaan, gaan we eerst kijken naar de evolutie van de termen. Een historisch onderzoek zal duidelijk maken hoe de termen momenteel worden gebruikt.
- Het woord 'Data Science' bestaat al in de jaren zestig, maar werd toen gebruikt als alternatief voor 'Computer Science'. Momenteel heeft het een heel andere betekenis.
- In 2008 werden DJ Patil en Jeff Hammerbacher de eerste personen die zichzelf 'Data Scientists' noemden om hun rol op LinkedIn en Facebook te beschrijven.
- In 2012 noemde het artikel van Harvard Business Review Data Scientist de 'meest sexy baan van de 21ste eeuw'.
- De term datamining is parallel geëvolueerd. Het werd gangbaar onder de database-gemeenschappen in de jaren 1990.
- Datamining dankt zijn oorsprong aan KDD (Knowledge Discovery in Databases). KDD is een proces waarbij kennis wordt gevonden uit informatie die aanwezig is in databases. En datamining is een belangrijk subproces in KDD.
- Datamining wordt vaak samen met KDD door elkaar gebruikt.
Hoewel deze namen onafhankelijk van elkaar in beeld zijn gekomen, komen ze vaak als complementair aan elkaar uit, omdat ze tenslotte nauw verwant zijn aan gegevensanalyse.
Head to Head-vergelijking tussen Data Science versus Data Mining (Infographics)
Hieronder vindt u de Top 9-vergelijking van Data Science versus datamining
Voorbeeld use case
Overweeg een scenario waarin u een grote retailer in India bent. U hebt 50 winkels in 10 grote steden in India en u bent 10 jaar operationeel.
Laten we zeggen dat u de gegevens van de afgelopen 8 jaar wilt bestuderen om het aantal snoepgoedverkopen te vinden tijdens feestelijke seizoenen van 3 steden. Als dat uw doelstelling is, zou ik u aanraden een persoon met datamining-expertise in dienst te nemen. Een Data Miner zou waarschijnlijk door historische informatie gaan die is opgeslagen in oude systemen en algoritmen gebruiken om trends te extraheren.
Overweeg een ander geval waarin u wilt weten welke snoepjes meer positieve beoordelingen hebben ontvangen. In dit geval zijn uw gegevensbronnen mogelijk niet beperkt tot databases, maar kunnen deze worden uitgebreid tot sociale websites of feedbackberichten van klanten. In dit geval zou mijn suggestie aan u zijn om een Data Scientist in dienst te nemen. Een persoon die werkzaam is als Data Scientist is meer geschikt om algoritmen toe te passen en deze sociaal-computationele analyse uit te voeren.
Belangrijkste verschillen tussen Data Science versus datamining
Hieronder is het verschil tussen data science en data mining als volgt
- Datamining is een activiteit die deel uitmaakt van een breder Knowledge Discovery in Databases (KDD) -proces, terwijl Data Science een vakgebied is, net als Applied Mathematics of Computer Science.
- Vaak wordt Data Science in brede zin bekeken, terwijl Data Mining als een niche wordt beschouwd.
- Sommige activiteiten onder Data Mining zoals statistische analyse, het schrijven van datastromen en patroonherkenning kunnen elkaar kruisen met Data Science. Daarom wordt Data Mining een subset van Data Science.
- Machine Learning in Data Mining wordt meer gebruikt bij patroonherkenning, terwijl het in Data Science algemener wordt gebruikt.
Notitie
- Data Science en Data Mining moeten niet worden verward met Big Data Analytics en men kan zowel Miners als Scientists aan grote datasets laten werken.
Data Science vs Data Mining Comparision Table
Basis voor vergelijking | Datamining | Data Science |
Wat is het? | Een techniek | Een gebied |
Focus | Bedrijfsproces | Wetenschappelijk onderzoek |
Doel | Maak gegevens bruikbaarder | Gegevensgerichte producten bouwen voor een organisatie |
uitgang | patronen | afwisselend |
Doel | Zoeken naar trends die voorheen niet bekend waren | Sociale analyse, voorspellende modellen bouwen, onbekende feiten blootleggen en meer |
Beroepsperspectief | Iemand met kennis van gegevensnavigatie en statistisch inzicht kan datamining uitvoeren | Een persoon moet Machine Learning, Programming, info-grafische technieken begrijpen en de domeinkennis hebben om datawetenschapper te worden |
Omvang | Datamining kan een subset van Data Science zijn, aangezien mijnbouwactiviteiten deel uitmaken van de Data Science-pijplijn | Multidisciplinair - Data Science bestaat uit datavisualisaties, Computationele sociale wetenschappen, statistiek, datamining, natuurlijke taalverwerking, et cetera |
Deals met (het type gegevens) | Meestal gestructureerd | Alle vormen van data - gestructureerd, semi-gestructureerd en ongestructureerd |
Andere minder populaire namen | Data-archeologie, informatie verzamelen, informatie ontdekken, kennisextractie | Datagestuurde wetenschap |
Conclusie - Data Science versus Data Mining
Dus hier is het! Ik weet zeker dat je je nu meer bewust bent van wat de belangrijkste verschillen tussen de twee zijn en in welke context de twee moeten worden gebruikt. Een ding dat u moet onthouden, is dat er geen formele en nauwkeurige definities van Data Science en Data Mining zijn. Er zijn nog steeds discussies gaande tussen de academische wereld en de industrie over wat een nauwkeurige definitie is. Iedereen bevindt zich echter op dezelfde pagina met betrekking tot de verschillen op hoog niveau en de beschrijvingen van de twee termen die we in dit artikel hebben onderzocht.
Aanbevolen artikel
Dit is een leidraad geweest voor Data Science Vs Data Mining, hun betekenis, Head-to-Head-vergelijking, belangrijkste verschillen, vergelijkingstabel en conclusie. U kunt ook de volgende artikelen bekijken voor meer informatie -
- Data Science en het groeiende belang ervan
- 7 Belangrijke technieken voor datamining voor de beste resultaten
- Predictive Analytics vs Data Science - Leer de 8 nuttige vergelijkingen
- 8 Belangrijke technieken voor datamining voor succesvol zakendoen