Hive, Hadoop के लिए एक डेटा वेयरहाउस सिस्टम है जो आसान डेटा संक्षेपण, तदर्थ क्वेरी और Hadoop संगत फ़ाइल सिस्टम में संग्रहीत बड़े डेटासेट के विश्लेषण की सुविधा देता है। हाइव संरचनाओं को अच्छी तरह से समझा डेटाबेस अवधारणाओं जैसे कि टेबल, पंक्तियों, कॉलम और विभाजन में डेटा। यह इंटेगर, फ्लोट्स, डबल्स और स्ट्रिंग्स जैसे आदिम प्रकारों का समर्थन करता है। हाइव एसोसिएटिव एरर्स, लिस्ट्स, स्ट्रक्चर और सीरियलाइज़ को भी सपोर्ट करता है और डेटा को टेबल के अंदर और बाहर ले जाने के लिए सीरियलाइज़्ड और डिसेरिएलाइज्ड एपीआई का इस्तेमाल किया जाता है।
सूचनात्मक में परिवर्तन के प्रकार
आइए हाइव डेटा मॉडल को विस्तार से देखें
हाइव डेटा मॉडल:
हाइव डेटा मॉडल में निम्नलिखित घटक होते हैं:
- डेटाबेस
- टेबल्स
- विभाजन
- बाल्टी या गुच्छे
विभाजन:
विभाजन का अर्थ है कि एक विभाजन स्तंभ के मान के आधार पर एक मोटे अनाज वाले भागों में एक तालिका को विभाजित करना जैसे कि 'डेटा'। इससे डेटा के स्लाइस पर प्रश्न करना तेज़ हो जाता है
कैसे एक सरणी सी + + सॉर्ट करने के लिए
तो, विभाजन का कार्य क्या है? विभाजन कुंजी यह निर्धारित करती है कि डेटा कैसे संग्रहीत किया जाता है। यहां, विभाजन कुंजी का प्रत्येक अद्वितीय मान तालिका के विभाजन को परिभाषित करता है। विभाजन सुविधा के नाम पर रखे गए हैं। यह HDFS में is ब्लॉक स्प्लिटिंग ’के समान है।
बाल्टी:
बाल्टी उन डेटा को अतिरिक्त संरचना देती है जिनका उपयोग कुशल प्रश्नों के लिए किया जा सकता है। दो स्तंभों का एक जोड़ जो एक ही कॉलम पर बकेट किए गए हैं, जिसमें शामिल कॉलम को मैप-साइड जॉइन के रूप में लागू किया जा सकता है। यूज्ड आईडी द्वारा बकेटिंग का मतलब है कि हम उपयोगकर्ताओं के कुल सेट के यादृच्छिक नमूने पर इसे चलाकर उपयोगकर्ता-आधारित क्वेरी का त्वरित मूल्यांकन कर सकते हैं।
क्या आप हमसे कोई प्रश्न पूछना चाहते हैं? कृपया टिप्पणी अनुभाग में उनका उल्लेख करें और हम आपके पास वापस आ जाएंगे।
संबंधित पोस्ट:
जावा में इटरेटर का उपयोग कैसे करें