हाइव डेटा मॉडल



Hive डेटा मॉडल में निम्नलिखित घटक होते हैं जैसे डेटाबेस, टेबल्स, पार्टीशन और बकेट या क्लस्टर्स। ये इंटेगर, फ्लोट्स, डबल्स और स्ट्रिंग्स जैसे आदिम प्रकारों का समर्थन करते हैं।

Hive, Hadoop के लिए एक डेटा वेयरहाउस सिस्टम है जो आसान डेटा संक्षेपण, तदर्थ क्वेरी और Hadoop संगत फ़ाइल सिस्टम में संग्रहीत बड़े डेटासेट के विश्लेषण की सुविधा देता है। हाइव संरचनाओं को अच्छी तरह से समझा डेटाबेस अवधारणाओं जैसे कि टेबल, पंक्तियों, कॉलम और विभाजन में डेटा। यह इंटेगर, फ्लोट्स, डबल्स और स्ट्रिंग्स जैसे आदिम प्रकारों का समर्थन करता है। हाइव एसोसिएटिव एरर्स, लिस्ट्स, स्ट्रक्चर और सीरियलाइज़ को भी सपोर्ट करता है और डेटा को टेबल के अंदर और बाहर ले जाने के लिए सीरियलाइज़्ड और डिसेरिएलाइज्ड एपीआई का इस्तेमाल किया जाता है।





सूचनात्मक में परिवर्तन के प्रकार

आइए हाइव डेटा मॉडल को विस्तार से देखें

हाइव डेटा मॉडल:

हाइव डेटा मॉडल में निम्नलिखित घटक होते हैं:



  • डेटाबेस
  • टेबल्स
  • विभाजन
  • बाल्टी या गुच्छे

विभाजन:

विभाजन का अर्थ है कि एक विभाजन स्तंभ के मान के आधार पर एक मोटे अनाज वाले भागों में एक तालिका को विभाजित करना जैसे कि 'डेटा'। इससे डेटा के स्लाइस पर प्रश्न करना तेज़ हो जाता है

कैसे एक सरणी सी + + सॉर्ट करने के लिए

हाइव डेटा मॉडल

तो, विभाजन का कार्य क्या है? विभाजन कुंजी यह निर्धारित करती है कि डेटा कैसे संग्रहीत किया जाता है। यहां, विभाजन कुंजी का प्रत्येक अद्वितीय मान तालिका के विभाजन को परिभाषित करता है। विभाजन सुविधा के नाम पर रखे गए हैं। यह HDFS में is ब्लॉक स्प्लिटिंग ’के समान है।



बाल्टी:

बाल्टी उन डेटा को अतिरिक्त संरचना देती है जिनका उपयोग कुशल प्रश्नों के लिए किया जा सकता है। दो स्तंभों का एक जोड़ जो एक ही कॉलम पर बकेट किए गए हैं, जिसमें शामिल कॉलम को मैप-साइड जॉइन के रूप में लागू किया जा सकता है। यूज्ड आईडी द्वारा बकेटिंग का मतलब है कि हम उपयोगकर्ताओं के कुल सेट के यादृच्छिक नमूने पर इसे चलाकर उपयोगकर्ता-आधारित क्वेरी का त्वरित मूल्यांकन कर सकते हैं।

क्या आप हमसे कोई प्रश्न पूछना चाहते हैं? कृपया टिप्पणी अनुभाग में उनका उल्लेख करें और हम आपके पास वापस आ जाएंगे।

संबंधित पोस्ट:

जावा में इटरेटर का उपयोग कैसे करें

सहायक हाइव कमांड्स