अपाचे हाइव का परिचय



अपाचे हाइव एक डेटा वेयरहाउसिंग पैकेज है जो हडोप के शीर्ष पर बनाया गया है और इसका उपयोग डेटा विश्लेषण के लिए किया जाता है। हाइव उन उपयोगकर्ताओं की ओर लक्षित है जो एसक्यूएल के साथ सहज हैं।

अपाचे हाइव एक डेटा वेयरहाउसिंग पैकेज है जो हडोप के शीर्ष पर बनाया गया है और इसका उपयोग डेटा विश्लेषण के लिए किया जाता है। हाइव उन उपयोगकर्ताओं की ओर लक्षित है जो एसक्यूएल के साथ सहज हैं। यह SQL के समान है और इसे HiveQL कहा जाता है, जिसका उपयोग संरचित डेटा के प्रबंधन और क्वेरी के लिए किया जाता है। अपाचे हाइव का उपयोग हडोप की जटिल जटिलता के लिए किया जाता है। यह भाषा पारंपरिक मानचित्र / प्रोग्रामर को अपने कस्टम मैपर्स और रीड्यूसर में प्लग करने की अनुमति देती है। हाइव की लोकप्रिय विशेषता यह है कि जावा को सीखने की कोई आवश्यकता नहीं है।





Hive, Hadoop पर आधारित एक ओपन सोर्स पेटा-बाइट स्केल डेट वेयरहाउसिंग फ्रेमवर्क, हाइव, को फेसबुक पर डेटा इन्फ्रास्ट्रक्चर टीम द्वारा विकसित किया गया था। हाइव भी उन तकनीकों में से एक है जिसका उपयोग फेसबुक पर आवश्यकताओं को पूरा करने के लिए किया जा रहा है। हाइव फेसबुक पर आंतरिक रूप से सभी उपयोगकर्ताओं के साथ बहुत लोकप्रिय है और इसका उपयोग विभिन्न प्रकार के अनुप्रयोगों के लिए सैकड़ों उपयोगकर्ताओं के साथ क्लस्टर पर हजारों नौकरियां चलाने के लिए किया जा रहा है। फेसबुक पर Hive-Hadoop क्लस्टर 2PB से अधिक कच्चे डेटा को संग्रहीत करता है और नियमित रूप से दैनिक आधार पर 15 TB डेटा लोड करता है।

आइए इसकी कुछ विशेषताओं पर नज़र डालें जो इसे लोकप्रिय और उपयोगकर्ता के अनुकूल बनाती हैं:



  • प्रोग्रामर को कस्टम मैपर्स और रीड्यूसर में प्लग करने की अनुमति देता है।
  • डेटा वेयरहाउस इन्फ्रास्ट्रक्चर है।
  • आसान डेटा ETL सक्षम करने के लिए उपकरण प्रदान करता है।
  • SQL जैसी क्वेरी भाषा को QL कहा जाता है।

अपाचे हाइव का उपयोग मामला - फेसबुक:

हाइव यूज केस - फेसबुक

हाइव को लागू करने से पहले, फेसबुक को बहुत सारी चुनौतियों का सामना करना पड़ा क्योंकि डेटा के आकार में वृद्धि या विस्फोट हुआ, जिससे उन्हें संभालना वास्तव में मुश्किल हो गया। पारंपरिक RDBMS दबाव को संभाल नहीं सका और परिणामस्वरूप फेसबुक बेहतर विकल्पों की तलाश में था। इस आसन्न मुद्दे को हल करने के लिए, फेसबुक ने शुरुआत में Hadoop MapReduce का उपयोग करने की कोशिश की, लेकिन SQL में प्रोग्रामिंग और अनिवार्य ज्ञान में कठिनाई के साथ, यह एक अव्यवहारिक समाधान बना। हाइव ने उन्हें उन चुनौतियों को पार करने की अनुमति दी जो वे सामना कर रहे थे।

शुरुआती पीडीएफ मुफ्त डाउनलोड के लिए सूचनात्मक ट्यूटोरियल

हाइव के साथ, वे अब निम्नलिखित प्रदर्शन करने में सक्षम हैं:



  • टेबल्स को जुदा और बाल्टी किया जा सकता है
  • स्कीमा लचीलापन और विकास
  • JDBC / ODBC ड्राइवर उपलब्ध हैं
  • Hive तालिकाओं को सीधे HDFS में परिभाषित किया जा सकता है
  • एक्स्टेंसिबल - प्रकार, प्रारूप, कार्य और स्क्रिप्ट

हेल्थकेयर में हाइव का उपयोग मामला:

हाइव का उपयोग कहां करें?

अपाचे हाइव का उपयोग निम्नलिखित स्थानों में किया जा सकता है:

  • डेटा खनन
  • प्रसंस्करण लॉग करें
  • दस्तावेज़ अनुक्रमण
  • कस्टमर फेसिंग बिजनेस इंटेलिजेंस
  • भविष्य कहनेवाला मॉडलिंग
  • परिकल्पना परीक्षण

छत्ता वास्तुकला:

हाइव में निम्नलिखित प्रमुख घटक होते हैं:

  • मेटास्टोर - मेटाडेटा को स्टोर करने के लिए।
  • JDBC / ODBC - SQL क्वेरी को MapReduce के अनुक्रम में परिवर्तित करने के लिए क्वेरी कंपाइलर और निष्पादन इंजन।
  • सर्ड और ऑब्जेक्ट इंस्पेक्टर - डेटा प्रारूपों और प्रकारों के लिए।
  • UDF / UDAF - उपयोगकर्ता परिभाषित कार्यों के लिए।
  • ग्राहक - MySQL कमांड लाइन और वेब UI के समान।

छत्ते के घटक:

मेटास्टोर:

कैसे कार्यक्रम जावा समाप्त करने के लिए - -

Metastore तालिकाओं, विभाजन, तालिकाओं के भीतर कॉलम के बारे में जानकारी संग्रहीत करता है। मेटास्टोर में भंडारण के 3 तरीके हैं: एंबेडेड मेटास्टोर, स्थानीय मेटास्टोर और रिमोट मेटास्टोर। ज्यादातर, रिमोट मेटास्टोर का उपयोग उत्पादन मोड में किया जाएगा।

.innerhtml क्या करता है

छत्ता की सीमाएं:

हाइव की निम्न सीमाएँ हैं और इन्हें ऐसी परिस्थितियों में उपयोग नहीं किया जा सकता है:

  • ऑनलाइन लेनदेन प्रसंस्करण के लिए नहीं बनाया गया है।
  • इंटरैक्टिव डेटा ब्राउज़िंग के लिए स्वीकार्य विलंबता प्रदान करता है।
  • वास्तविक समय के प्रश्नों और पंक्ति स्तर के अद्यतनों की पेशकश नहीं करता है।
  • हाइव प्रश्नों के लिए विलंबता आम तौर पर बहुत अधिक है।

क्या आप हमसे कोई प्रश्न पूछना चाहते हैं? उन्हें टिप्पणी अनुभाग में उल्लेख करें और हम आपके पास वापस आ जाएंगे।

संबंधित पोस्ट:

हाइव कमांड्स