Introductie op Hive Drop Table

Het trefwoord 'DROP' verwijst naar verwijdering. Voor het verwijderen van gegevens hebben we gegevens nodig die aanwezig zijn in de component.

In Hadoop hebben we twee functionaliteiten:

  1. Gegevens opslag
  2. Gegevensverwerking

Voor gegevensopslag komt HDFS (Hadoop Distributed File System) in beeld. Als we nu zeggen dat we gegevens in de componenttabel hebben, betekent dit twee dingen:

  1. Gegevens zijn in HDFS
  2. We hebben een componenttabel gemaakt over dat HDFS-bestand en we laden de gegevens van dat HDFS-bestand in de componenttabel.

Dus in feite is het gegevensbestand een voorwaarde voor de bijenkorf-drop-tabel om de gegevens te hebben. In dit artikel gaan we bekijken hoe u tabellen in de component kunt neerzetten, wat er gebeurt wanneer de tabel wordt neergezet en alle dingen die verband houden met de drop-tabel in de component.

Soorten Drop Table in Hive

In de component zijn er twee soorten tabellen:

  1. Interne tabel of beheerde tabel
  2. Externe tabel of onbeheerde tabel

Beheerde tabel / interne tabel:

  1. In Hive is " gebruiker / hive / magazijn " de standaardmap. Interne tabellen worden standaard in deze map opgeslagen. We hoeven de locatie niet handmatig op te geven tijdens het maken van de tabel.
  2. Met de opdracht "Drop table" worden de gegevens permanent verwijderd.
  3. Hive beheert alle beveiliging voor beheerde tabellen.

Ik heb al een tabel in de map "user / hive / warehouse" met de naam "codes".

Om te controleren of de bestaande tabel wordt beheerd of onbeheerd, kunnen we de onderstaande opdracht gebruiken:

Opdrachtsyntaxis:

Beschrijf de opgemaakte tabelnaam;

Output:

Laten we eens kijken, de gegevens gepresenteerd in tabel "codes".

Eerst met behulp van hive command-

Ten tweede, het gebruik van Hue (Hadoop User Experience een Web UI)

Wisopdracht: Drop table table_name;

Output:

Als ik nu de gegevens uit "codes" wil selecteren, krijg ik een foutmelding omdat de tabel is verwijderd.

Ook kan deze tabel niet worden weergegeven in de standaardmap die is

“Gebruiker / bijenkorf / magazijn”

Let hier op

Onbeheerde tafel / Externe tafel:

  1. Externe tabellen, we moeten het pad opgeven waar we die tabel moeten opslaan met behulp van het trefwoord 'location' in de opdracht create table.

Bijvoorbeeld:

CREËER EXTERNE TABEL stg_s2_json.products

(product geen string, productnaam string, beschrijving string, actieve string, gecreëerde datum string, bijgewerkte datum string) rij-indeling gescheiden velden afgesloten door ', '

LOCATIE '/user/data/hive/stg_s2_json.db/products';

  1. Hive verwijdert alleen de metagegevens. Gegevens zijn permanent.
  2. Deze tabellen kunnen worden gebruikt door iedereen die toegang heeft tot HDFS, dus moeten ze de beveiliging op mapniveau beheren.

Om inzicht te krijgen in de dropping van de externe tabel, zullen we de tabel “producten” gebruiken.

Laten we controleren of de tabel intern of extern is. Nogmaals, "opdracht geformatteerde tabelnaam" -opdracht.

Let op "limiet 10" in het select commando. Table Products bevat de onderstaande gegevens:

Om het in Hue te controleren, ziet het er zo uit:

Laten we eens kijken wat er gebeurt als we deze tabel laten vallen:

Syntaxis:

Drop table table_name;

Output:

Als u nu probeert de gegevens van de tabel op te halen, geeft dit een foutmelding.

Als eerste, met behulp van de opdracht "select" op de terminal, geeft dit een foutmelding, wat betekent dat de metagegevens voor de externe tabel worden verwijderd.

Let hier op de fout:

Ten tweede is het bestand “products.json” nog steeds aanwezig in HDFS, wat betekent dat de gegevens permanent zijn.

Conclusie

Ik ga het u gemakkelijk maken en u belangrijke punten geven voor beide soorten tabellen. U beslist welk type aan uw eisen voldoet.

Interne tabel

Externe tabel

Wordt ook "beheerde tabel" genoemdOok wel "Onbeheerde tabel" genoemd
Geen locatie nodig, Hive default directory beheert deze gegevensMoet locatie opgeven
Verwijdert de metagegevens van de tabel en (gegevens zijn tijdelijk)Hive laat de gegevens ongemoeid (gegevens zijn permanent)
De korf zelf controleert de beveiliging van de tabelMoet de beveiliging op mapniveau beheren

Aanbevolen artikelen

Dit is een gids voor Hive Drop Table. Hier bespreken we de introductie van Hive Drop Table, soorten Drop Table in Hive langs syntaxis. U kunt ook onze andere voorgestelde artikelen doornemen voor meer informatie -

  1. Wat is een bijenkorf?
  2. Bijenkorf architectuur
  3. Hive Commands
  4. Wat is Oracle-database
  5. Bijenkorf sorteren op
  6. Bijenkorfinstallatie

Categorie: