Wat is datavisualisatie?

En waarom we niet meer zorgen voor cirkeldiagrammen,

Datavisualisatie is niet alleen een vertaling van datapunten in schamele staafdiagrammen en lijngrafieken. Het is als een duik in een oceaan die schatten op elk niveau verbergt. Vanaf het allereerste begin hebben we de duidelijke afbakening van gegevens in handboekfiguurtjes namelijk. spreidingsplots, lijngrafieken, cirkeldiagrammen en staafdiagrammen. Lijndiagrammen worden meestal gebruikt om een ​​gegevenstrend in de tijd weer te geven. In dit onderwerp van wat datavisualisatie is, hebben we het hele concept vooruit met de gegeven grafiek en cirkeldiagrammen gewist.

Taartpunten

Een van de meest gebruikte grafieken is de pizzadiagram of het cirkeldiagram.

Aandeel gassen in een mengsel.

Bron : plotly

Vaak gebruikt tijdens verkiezingen om te laten zien welke partij de leeuwen heeft om te stemmen, heeft deze grafiek, hoewel zeer populair, enkele opvallende nadelen. Statistici als Edward Tufte, Leland Wilkinson en Gerald van Belle hebben hun afkeer uitgesproken van het gebruik van cirkeldiagrammen. Het meest overtuigende bewijs tegen cirkeldiagrammen is waarschijnlijk geleverd door Stephen Few, de oprichter van Perceptual Edge. In zijn artikel “Save the Pie for the Dessert” gepubliceerd in de Visual Business Intelligence Nieuwsbrief, legt Stephen uit waarom hij tot verrassing van zijn collega's en studenten vindt dat cirkeldiagrammen een ineffectief middel zijn om gegevens te visualiseren.

Bekijk het cirkeldiagram hieronder.

In deze grafiek met het aandeel bestelde etenswaren na 21.00 uur, is het gemakkelijk om het percentage ijs te schatten - 25%. Na een kleine aanpassing is het echter niet langer mogelijk om eenvoudig het percentage bestellingen voor ijs te bepalen.

Hoewel het percentage ijsjes nog steeds hetzelfde is met 25%. Het is moeilijk te begrijpen uit het bovenstaande diagram. In het vorige diagram was het gemakkelijk om het percentage te raden omdat de schaduw voor ijs begon op 6 uur positie en zich uitstrekte tot de 9 uur positie. Omdat onze ogen zijn getraind om de klokken op 12, 3, 6 en 9 te zien, is een cirkeldiagram ook eenvoudiger te interpreteren als de regio's zich houden aan de 4 klokposities. Een fervent supporter van een cirkeldiagram zou naar voren komen en suggereren dat dit probleem gemakkelijk kan worden vermeden door labels te gebruiken en het percentage voor elke regio te markeren.

Cirkeldiagram met gegevenslabels

Maar nogmaals, om de waarde met het item in kaart te brengen, moeten onze ogen de focus blijven verleggen van de legenda onderaan de grafiek naar de labels op de grafiek. De oplossing hiervoor zou zijn om de itemnaam ook samen met de waarden te koppelen om zoiets als dit te krijgen:

Perfect, zou je zeggen. Maar dan vraag ik je - Nu we de namen van de items samen met de waarden hebben bijgevoegd, is het cirkeldiagram hierboven anders dan de onderstaande tabel:

Schone tabel met gegevens gesorteerd op Percentage van bestelling

Ziet deze informatie er niet veel beter uit dan de labels en legendes verspreid over het cirkeldiagram. Wat is het nut van een cirkeldiagram dan? Visualisaties worden verondersteld waarde toe te voegen, ze zijn agenten van conclusies, ze moeten de gegevens geheimen doen onthullen. Maar in dit geval komt het cirkeldiagram zijn belofte niet na.

Voer het staafdiagram van gegevensvisualisatie in

Het slankere en veel elegantere alternatief voor het cirkeldiagram is het staafdiagram, dat in staat is om alles wat de taart zegt en nog veel meer tot uitdrukking te brengen, zonder een warboel van labels en legendes te maken.

Staafdiagram met hetzelfde - eenvoudig te vergelijken, contrasteren en concluderen

Dit is dezelfde informatie die nu zachtjes aan de waarnemer wordt gepresenteerd. Naast het tonen van de individuele waarden, stelt deze grafiek ons ​​in staat om snel de populariteit van elk voedingsmiddel te vergelijken en zelfs het relatieve waardeverschil tussen opeenvolgende artikelen te vergelijken. Dezelfde gegevens zouden via de tabel beschikbaar zijn geweest, maar onze hersenen zijn beter in het verwerken van afbeeldingen dan in het ontcijferen van de tekst. Daarom is het gebruik van het cirkeldiagram in de loop van de tijd minder geworden. Hoewel een favoriete visual in de media-industrie, is deze vervangen door betere en meer verfijnde representaties. Naast lijngrafieken, taarten en staafdiagrammen zijn er nog talloze andere grafieken die van pas komen. Een interessante grafiek, maar niet zo populair voor niet-ingewijden, is het Sankey-diagram. Dit diagram wordt gebruikt om de verdeling en stroom van materie uit te drukken. De kwestie in kwestie kan energie, geld of zelfs water zijn.

Sankey Diagram van de energiestroom en distributie van een typische IT-medewerker.

Hierboven is een fictief Sankey-diagram dat aangeeft hoe en waar de meeste energie van een IT-medewerker wordt gedistribueerd.

Nieuwere tools

Met de komst van sociale media en de verschillende platforms waar mensen hun gevoelens, beoordelingen en meningen kunnen uitschrijven, is een woordvisualisatie-tool die vrij gebruikelijk is geworden de woordwolk. Woordwolken helpen ons uit te vinden waar mensen het over hebben.

Een zeer echte, live word cloud-weergave van de gebruikersrecensies van PUBG in de Google Play Store

Als we hier naar de woordwolk kijken die is opgebouwd uit de top 80 beoordelingen van de game PUBG in de Google Play Store, zien we dat de algehele reactie op de game "goed" is, sommige mensen noemen het zelfs de "beste" . Het lijkt er echter op dat er een probleem is met sommige "updates" die de mensen smeken bij de makers van de game om dit recht te zetten. Inderdaad, wanneer we de beoordelingen van de speelwinkel op die dag bekijken, zien we hetzelfde weerspiegeld.

Het probleem met updates. Kijk ook of je hier het woord 'alsjeblieft' kunt vinden

De toekomst

Dit is slechts het topje van de ijsberg krabben. Bibliotheken zoals plotly en D3 hebben datavisualisatie naar een ander niveau gebracht. Dit is gebeurd omdat ook de vraag is veranderd. Hoe zou u een slimme stad op een dashboard visualiseren? Een gigantisch scherm waarop de vitalen van een hele stad kunnen worden weergegeven. Het verkeer, stroomverbruik, de gezondheidsomstandigheden van verschillende gebieden, luchtkwaliteit en tal van andere parameters moeten op één pagina worden weergegeven. Deze vereiste vraagt ​​om een ​​andere benadering van datavisualisatie Dus we hebben geleerd dat wat datavisualisatie is met behulp van dit concept. We kunnen niet langer vasthouden aan grafieken en diagrammen. Een nieuwe aanpak is vereist waar grafieken kunst en verbeelding ontmoeten, waardoor een verrijkende visuele ervaring ontstaat. Die discussie roept een heel ander artikel op. Tot de volgende keer.

Aanbevolen artikelen

Dit artikel is een handige gids voor wat een datavisualisatie is. Hier hebben we de basisconcepten met grafieken en grafieken besproken, zodat u gegevensvisualisatie gemakkelijk kunt begrijpen. U kunt ook het volgende artikel bekijken voor meer informatie -

  1. Carrière in Oracle Database Administrator
  2. 7 Meest bruikbare verschil tussen datamining versus webmining
  3. Data Analytics Interview Vragen
  4. Big Data Analytics-voorbeelden

Categorie: