Introductie tot Cassandra: sollicitatievragen

Apache Cassandra is een zeer beschikbaar “NoSQL” gedistribueerd databasebeheersysteem. Het is een type NoSQL-database. Cassandra is open-source en is zodanig ontworpen dat het grote hoeveelheden gegevens kan verwerken, met een hoge beschikbaarheid die geen enkel storingspunt heeft. Cassandra werd een Apache-project op het hoogste niveau in 2010. Cassandra is geschreven in de Java-taal en kan daarom op een groot aantal besturingssystemen en platforms worden uitgevoerd. Het kan flexibel zijn in het realtime opslaan van de gegevens voor de online applicaties en het kan gegevens lezen voor het business intelligence-systeem.

Lijst met top 10 veelgestelde vragen en antwoorden van Cassandra voor 2019:

Dus je hebt eindelijk je droombaan in Cassandra gevonden, maar je vraagt ​​je af hoe je het Cassandra Interview 2019 kunt kraken en wat de waarschijnlijke Cassandra-interviewvragen kunnen zijn. Elk Cassandra-interview is anders en de reikwijdte van een baan is ook anders. Met dit in gedachten hebben we de meest voorkomende Cassandra-interviewvragen en -antwoorden ontworpen om u te helpen succesvol te worden in uw interview.

1. Wat is NoSQL? Hoeveel soorten NoSQL-databases zijn er?

Antwoord:
NoSQL (soms uitgebreid tot "niet alleen SQL") kan een brede categorie beheersystemen zijn die op een aantal belangrijke manieren afwijkt van het klassieke model van het relationele databasebeheersysteem (RDBMS).

NoSQL-systemen:
- Specifiek ontworpen voor topbelasting
- Ondersteuning van native horizontale schaalbaarheid
- Sla gegevens meestal niet op in een tabel
- Soms bieden ultieme consistentie in plaats van ACID-transacties
- Fouttolerant
- Bewaar gegevens op gedemoraliseerde wijze

In tegenstelling tot RDBMS, NoSQL-systemen:
• Meestal geen ondersteuning bieden voor gedistribueerde transacties
• Garandeer geen consistentie van gegevens
• Gebruik soms niet enkele geavanceerde ideeën van RDBMS, zoals triggers, weergaven, wachtprocedures

NoSQL-implementaties kunnen worden gecategoriseerd op basis van hun implementatiemethode:
1. Documentwinkels (MongoDB, Couchbase)
2. Sleutel / waarde-winkels (Redis, Voldemort)
3. Kolomwinkels (Cassandra)
4. Grafiekwinkels (Neo4j, Giraph)
5. Meerwaardige databases
6. Objectdatabases
7. Triplestore
8. Tuple-winkel

2. Leg uit wat Cassandra is? Waarom heeft Cassandra de voorkeur boven verschillende NoSQL-databases zoals HBase?

Antwoord:
Apache Cassandra is een zeer beschikbaar "NoSQL" gedistribueerd databasebeheersysteem dat een open source is en is ontworpen om grote hoeveelheden gegevens te verwerken, met een hoge beschikbaarheid zonder single point of failure. Cassandra werd ontwikkeld op Facebook en nadat Facebook de code open source had gemaakt, werd Cassandra in 2010 een Apache-project op het hoogste niveau. Het is een type NoSQL-database. Cassandra is geschreven in Java en kan op een groot aantal besturingssystemen en platforms worden uitgevoerd. Het kan als beide dienen
• Real-time gegevensopslagsysteem voor online applicaties
• Lees ook gegevens voor het business intelligence-systeem

Voor prestaties en beschikbaarheid is de Cassandra ontworpen voor grootschalige gedistribueerde gegevens en geoptimaliseerd voor zeer snel schrijven.

De verschillende factoren die verantwoordelijk zijn voor het gebruik van Cassandra zijn

• Schaalbaarheid van gigabytes naar petabytes
• Het kan kolomgerichte informatie zijn
• Geen enkel doel van mislukking
• Geen behoefte aan een afzonderlijke cachelaag
• Flexibele schemastijl
• Het heeft veelzijdige gegevensopslag, eenvoudige kennisdistributie en snel schrijven
• Het ondersteunt de eigenschappen ZUUR (Atomiciteit, Consistentie, Isolatie en Duurzaamheid)
• Geschikt voor meerdere datacenters en cloud
• Data compressie

3. Wat is SSTable?

Antwoord:
SSTable is ook bekend als 'Sorted String Table'. Daarin worden memtables op schijf opgeslagen en bestaan ​​ze voor elke Cassandra-tabel. Omdat SStables onveranderlijk is, is het niet mogelijk verdere gegevens toe te voegen en te verwijderen nadat ze eenmaal zijn geschreven. Voor elke SSTable worden 3 bestanden door Cassandra gemaakt, zoals partitie-index, partitieoverzicht en een bloeifilter.

4. Definieer Mem-tabel in Cassandra?

Antwoord:
Het is een geheugenresidente gegevensstructuur. eenmaal het logboek vastleggen, wordt de info naar de mem-tabel geschreven. Mem-table is een in-memory / write-back cache-huis dat bestaat uit inhoud in sleutel- en kolomformaat. De info in een tabel wordt op sleutel gesorteerd en elke kolomfamilie bestaat uit een duidelijke mem-tabel die kolomkennis via de sleutel ophaalt.

5. Hoe bewaart Cassandra gegevens?

Antwoord:
• Alle gegevens worden vastgehouden als bytes
• Wanneer u validator opgeeft, zorgt Cassandra ervoor dat die vierkante bytes van bytes worden gecodeerd volgens vraag.
• Hoewel composiet alleen byte-arrays zijn met een specifieke codering, slaat het voor elk element een lengte van twee bytes op, gevolgd door het gecodeerde element van de computergeheugeneenheid gevolgd door een afsluitbit.

6. Noem wat zijn Cassandra- CQL-collecties?

Antwoord:
Cassandra biedt een prompt Cassandra-querytaalshell (cqlsh) waarmee u Cassandra Query Language (CQL) kunt uitvoeren. In Cassandra kunt u CQL-collecties op de volgende manieren gebruiken
• Lijst: deze wordt gebruikt zodra de volgorde van de info moet worden gehandhaafd en de waarde meerdere keren moet worden bewaard (bevat de lijst met onderscheidende elementen)
• SET: het wordt gebruikt voor het cluster van componenten om op te slaan en kwam terug in gesorteerde orders
• MAP: het is een gegevenstype dat wordt gebruikt om een ​​sleutel / waarde-paar elementen op te slaan

7. Uitleggen van het Cassandra-datamodel?

Antwoord:
Het Cassandra-datamodel bestaat uit 4 hoofdpijlers: de cluster, keyspace, kolom, kolom & familie.
Clusters - Clusters bevatten veel knooppunten (machines) en kunnen meerdere hoofdruimten bevatten.
Keyspace - Een keyspace is een naamruimte om meerdere kolomfamilies te groeperen.
Kolom - Een kolom bevat een naam, waarde en tijdstempel.
Familie - Een kolomfamilie bevat meerdere kolommen waarnaar wordt verwezen door een rij sleutels.

8. Leg uit hoe Cassandra schrijft?

Antwoord:
Cassandra schrijft eerst gegevens naar een vastleggingslogboek en koppelt vervolgens in memtable en in een tabel. Een schrijven is succesvol wanneer beide commits zijn voltooid. Memtables en SSTables worden per kolomfamilie gemaakt. Schrijven worden naar schijf geschreven in een tabelstructuur die een SSTable wordt genoemd (gesorteerde stringtabel). In het geval van een fout zal het schrijven naar de SSTable Cassandra alleen het vastleg-logbestand herhalen. Met deze stijl heeft Cassandra de laagste I / O-schijf en biedt hoge schrijfprestaties als gevolg van het vastleg-logboek is alleen toevoegen en Cassandra zoekt niet naar schrijft.

9. Leg uit hoe Cassandra gegevens verwijdert?

Antwoord:
SSTables zijn onveranderlijke tabellen. zodra een rij moet worden verwijderd, wijst Cassandra de kolomwaarde toe aan een speciale waarde die Tombstone wordt genoemd. Nadat de gegevens zijn gelezen, wordt de Tombstone-waarde in aanmerking genomen als verwijderd.

10. Wat is instelbare consistentie in Cassandra? Hoeveel soorten instelbare consistentie worden in Cassandra ondersteund?

Antwoord:
Aanpasbare consistentie kan een fantastisch kenmerk van Cassandra zijn, waardoor het een voorkeurskeuze is. Consistentie verwijst naar de up-to-date en synchrone gegevensrijen op al hun replica's. Cassandra's Tunable Cassandra's Tunable Consistentie helpt gebruikers om de consistentie te kiezen die het meest geschikt is voor hun gebruik.
Het ondersteunt twee consistenties: Eventuele Consistentie en Sterke Consistentie.
Eventuele consistentie - De uiteindelijke consistentie wordt gebruikt zodra er geen nieuwe updates zijn gemaakt voor een gegeven gegevensitem, alle toegangen komen uiteindelijk terug naar de laatst bijgewerkte waarde. Systemen met uiteindelijke consistentie beroemd om eigen bereikte reproductieconvergentie.
Cassandra volgende voorwaarden voor robuuste consistentie:
R + W> N
Hier
N: Aantal replica's
W: Aantal knooppunten dat akkoord moet gaan voor een succesvol schrijven
R: Aantal knooppunten dat akkoord moet gaan voor een succesvol lezen

Aanbevolen artikel

Dit is een handleiding voor de lijst met Cassandra-interviewvragen en -antwoorden, zodat de kandidaat deze Cassandra-interviewvragen gemakkelijk kan beantwoorden. Dit artikel bestaat uit alle top Cassandra-interviewvragen en -antwoorden. U kunt ook de volgende artikelen bekijken voor meer informatie -

  1. 5 interessante interviewvragen die u moet weten! (Onthouden)
  2. Interviewvragen voor een Equity Researcher
  3. 20 spannende sollicitatievragen voor een projectmanager
  4. Factoren over op competentie gebaseerd interview (gids)
  5. Wat zijn NOSQL-vaardigheden
  6. Is Cassandra NoSQL?