Inleiding tot Data Analytics Interview Vragen en Antwoord

Dus je hebt eindelijk je droombaan gevonden in Data Analytics, maar je vraagt ​​je af hoe je het Data Analytics-interview in 2019 kunt kraken en wat de waarschijnlijke interviewvragen voor Data Analytics kunnen zijn. Elk Data Analytics-interview is anders en de reikwijdte van een taak is ook anders. Met dit in gedachten hebben we de meest voorkomende interviewvragen en antwoorden voor Data Analytics ontworpen om u te helpen succes te behalen in uw Data Analytics-interview.

Hieronder staan ​​de Top 2019 Data Analytics Interview-vragen die meestal in een interview worden gesteld

1. Wat is het verschil tussen datamining en data-analyse?

Antwoord:

DataminingGegevens analyse
Een hypothese is niet vereist voor dataminingGegevensanalyse begint met een hypothese.
Datamining vereist schone en goed gedocumenteerde gegevens.Gegevensanalyse omvat gegevens opschonen.
Resultaten van datamining zijn niet altijd gemakkelijk te interpreteren.Data-analisten interpreteren de resultaten en presenteren deze aan de stakeholders.
Datamining-algoritmen ontwikkelen automatisch vergelijkingen.Gegevensanalisten moeten hun eigen vergelijkingen ontwikkelen.

2. Noem wat de verschillende stappen in een analyseproject zijn?

Antwoord:
Gegevensanalyse gaat over het verzamelen, opschonen, transformeren en modelleren van gegevens om waardevolle inzichten te verkrijgen en betere besluitvorming in een organisatie te ondersteunen. Stappen die betrokken zijn bij het data-analyseproces zijn als volgt -

Gegevensverkenning - Nadat het bedrijfsprobleem is verkend, moet een gegevensanalist de oorzaak van het probleem analyseren.
Gegevensvoorbereiding - In deze stap van het gegevensanalyseproces vinden we gegevensafwijkingen zoals ontbrekende waarden in de gegevens.
Gegevensmodellering - De modelleringsstap begint nadat de gegevens zijn voorbereid. Modellering is een iteratief proces waarbij het model herhaaldelijk wordt uitgevoerd voor verbeteringen. Datamodellering zorgt voor het best mogelijke resultaat voor een bedrijfsprobleem.
Validatie - In deze stap worden het door de klant geleverde model en het door de data-analist ontwikkelde model tegen elkaar gevalideerd om te bepalen of het ontwikkelde model aan de zakelijke vereisten voldoet.
Implementatie van het model en tracking - In deze laatste stap van het gegevensanalysemodel wordt de implementatie uitgevoerd en daarna wordt gevolgd om te zorgen dat het model correct wordt geïmplementeerd of niet?

3.Wat is de verantwoordelijkheid van een data-analist?

Antwoord:
• Los zakelijke problemen op voor klanten en voer data-auditoperaties uit.
• Gegevens interpreteren met behulp van statistische technieken.
• Identificeer gebieden voor verbetermogelijkheden.
• Analyseer, identificeer en interpreteer trends of patronen in complexe datasets.
• Gegevens ophalen uit primaire of secundaire gegevensbronnen.
• Onderhoud databases / gegevenssystemen.
• Lokaliseer en corrigeer codeproblemen met behulp van prestatie-indicatoren.
• Beveiliging van de database door het ontwikkelen van een toegangssysteem.

4.Wat zijn botsingen tussen hashtafels? Hoe wordt het vermeden?

Antwoord:
Een hashtabelbotsing vindt plaats wanneer twee verschillende toetsen hash voor dezelfde waarde hebben. Er zijn veel technieken om botsingen tussen hashtabellen te voorkomen. Hier volgen er twee:
Afzonderlijke Chaining: het gebruikt de gegevensstructuur die in dezelfde sleuf hass om meerdere items op te slaan.
Open adressering: het zoekt naar andere slots met behulp van een tweede functie en slaat item op in het eerste lege slot.

5. Lijst van enkele beste tools die nuttig kunnen zijn voor data-analyse?

Antwoord:
•Tableau
• RapidMiner
• OpenRefine
• KNIME
• Google-zoekoperators
• Solver
• NodeXL
•io
• Wolfram Alpha
• Google Fusion Tables

6.Wat is het verschil tussen datamining en dataprofilering?

Antwoord:
Het verschil tussen datamining en dataprofilering is als volgt -
• Gegevensprofilering: het richt zich op de onmiddellijke analyse van individuele attributen zoals prijsvariatie, afzonderlijke prijs en frequentie, een aantal nulwaarden, gegevenstype, lengte, enz.
• Datamining: het concentreert zich op afhankelijkheden, reeksontdekking, relaties tussen verschillende attributen, clusteranalyse, detectie van ongebruikelijke records enz.

7. Verklaar K-gemiddelde algoritme en hiërarchisch clusteringalgoritme?

Antwoord:
K-Mean Algorithm - K Mean is een beroemde partitioneringsmethode. In het K-gemiddelde algoritme zijn de clusters bolvormig, dwz de gegevenspunten in een cluster zijn gecentreerd op dat cluster. Ook is de variantie van de clusters vergelijkbaar, dat wil zeggen dat elk gegevenspunt tot de dichtstbijzijnde cluster behoort
Hiërarchisch clusteringalgoritme - Hiërarchisch clusteringalgoritme combineert en verdeelt bestaande groepen en maakt een hiërarchische structuur voor hen om de volgorde te tonen waarin groepen zijn verdeeld.

8.Wat is het opschonen van gegevens? Noem enkele best practices die u moet volgen tijdens het opschonen van gegevens?

Antwoord:
Uit een gegeven dataset is het uiterst belangrijk om de informatie te sorteren die nodig is voor data-analyse. Gegevens opschonen is een cruciale stap waarbij gegevens worden geïnspecteerd om eventuele afwijkingen te vinden, repetitieve en onjuiste informatie te verwijderen, enz. Bij gegevens opschonen hoeft geen bestaande informatie uit de database te worden verwijderd, het verbetert alleen de gegevenskwaliteit zodat het kan worden gebruikt voor analyse .
Enkele van de best practices voor het opschonen van gegevens zijn:
• Het ontwikkelen van een datakwaliteitsplan om te identificeren waar maximale datakwaliteitsfouten optreden, zodat u de grondoorzaak kunt beoordelen en op basis daarvan kunt plannen.
• Volg een gebruikelijke methode om de benodigde informatie te onderbouwen voordat deze in de informatie wordt ingevoerd.
• Identificeer eventuele dubbele gegevens en valideer de nauwkeurigheid van de gegevens, omdat dit veel tijd zal besparen tijdens de analyse.
• Het bijhouden van alle verbeteracties die op de informatie zijn uitgevoerd, is ongelooflijk noodzakelijk om eventuele handelingen te herhalen of weg te nemen.

9.Wat zijn enkele van de statistische methoden die nuttig zijn voor data-analisten?

Antwoord:
Statistische methoden die nuttig zijn voor datawetenschappers zijn
• Bayesiaanse methode
• Markov-proces
• Ruimtelijke en clusterprocessen
• Rangstatistieken, percentiel, detectie van uitbijter
• Berekeningstechnieken, enz.
• Simplex algoritme
• Wiskundige optimalisatie

10. Leg uit wat toerekening is? Verschillende soorten imputatietechnieken opsommen? Welke toerekeningsmethode is gunstiger?

Antwoord:
Tijdens de toerekening hebben we de neiging om ontbrekende informatie te vervangen door gesubstitueerde waarden. De soorten imputatietechnieken zijn:
• Enkele imputatie: enkele imputatie geeft aan dat de ontbrekende waarde wordt vervangen door een waarde. Bij deze methode wordt de steekproefgrootte opgehaald.
• Hot-deck imputatie: een ontbrekende waarde wordt met behulp van een ponskaart ingevoerd uit een willekeurig gekozen vergelijkbaar record
• Cold deck-imputatie: het werkt hetzelfde als hot-deck imputatie, maar iets geavanceerder en kiest donoren uit andere datasets
• Gemiddelde toerekening: hierbij wordt de ontbrekende waarde vervangen door de voorspelde waarden van andere variabelen.
• Regressie-imputatie: hierbij wordt de ontbrekende waarde vervangen door de voorspelde waarden van een bepaalde waarde, afhankelijk van andere variabelen.
• Stochastische regressie: het is hetzelfde als regressie-imputatie, maar het voegt de gemeenschappelijke regressievariantie toe aan de regressie-imputatie
• Meerdere imputatie: in tegenstelling tot enkele imputatie, schatten meerdere imputaties de waarden meerdere keren

Hoewel een enkele toerekening op grote schaal wordt gebruikt, weerspiegelt dit niet de onzekerheid die is ontstaan ​​door het willekeurig missen van gegevens. Meerdere imputaties zijn dus gunstiger dan enkele imputatie in het geval dat gegevens willekeurig ontbreken.

Aanbevolen artikelen

Dit is een uitgebreide gids geweest voor de Data Analytics Interview Vragen en antwoorden, zodat de kandidaat deze Data Analytics Interview Vragen gemakkelijk kan beantwoorden. U kunt ook de volgende artikelen bekijken voor meer informatie -

  1. 10 Handige Agile-interviewvragen en -antwoorden
  2. 8 geweldige sollicitatievragen voor algoritmen
  3. 25 Belangrijkste sollicitatievragen voor informatica
  4. 10 geweldige sollicitatievragen en antwoorden voor Data Engineer