हाइव लिपियों को कैसे चलाएं?



यह कैसे हाइव लिपियों को चलाने के लिए एक ट्यूटोरियल है। इस स्क्रिप्ट को चलाने से हम प्रत्येक कमांड को मैन्युअल रूप से लिखने और निष्पादित करने में लगने वाले समय और प्रयास को कम कर देंगे।

Hadoop के शीर्ष पर बनाया गया Data Warehousing पैकेज होने के नाते, Apache Hive का डेटा विश्लेषण, डेटा खनन और भविष्य कहनेवाला मॉडलिंग के लिए उपयोग किया जा रहा है। संगठन एक मजबूत पकड़ के साथ पेशेवरों की तलाश कर रहे हैं । इस पोस्ट में, हाइव लिपियों को चलाने के तरीके पर ध्यान दें। सामान्य तौर पर, हम एक ही बार में स्टेटमेंट के सेट को निष्पादित करने के लिए स्क्रिप्ट का उपयोग करते हैं। हाइव लिपियों का उपयोग उसी तरह से किया जाता है। यह प्रत्येक कमांड को मैन्युअल रूप से लिखने और निष्पादित करने के लिए हमारे द्वारा लगाए गए समय और प्रयास को कम करेगा।

हाइव लिपियों को हाइव 0.10.0 और इसके बाद के संस्करण में समर्थित हैं। चूंकि HH 0.90 संस्करण CDH3 में स्थापित है, हम HH लिपियों को CDH3 में नहीं चला सकते। आप CDH4 में नीचे दिए गए चरणों को आजमा सकते हैं क्योंकि इसमें Hive 0.10.0 संस्करण है। क्या आप जानते हैं कि हाइव स्क्रिप्ट कैसे बनाते हैं? यदि नहीं, तो क्लिक करें अधिक स्पष्टीकरण प्राप्त करने के लिए।





जावा में क्रमिक क्या है

Master-Hive-Now

अब, देखते हैं कि हाइव में स्क्रिप्ट कैसे लिखें और उन्हें CDH4 में चलाएं:



चरण 1: एक हाइव स्क्रिप्ट लिखना।

हाइव स्क्रिप्ट लिखने के लिए फ़ाइल को .sql एक्सटेंशन के साथ सहेजा जाना चाहिए। अपने Cloudera CDH4 वितरण में एक टर्मिनल खोलें और हाइव स्क्रिप्ट बनाने के लिए निम्न कमांड दें।
आदेश: sudo gedit sample.sql

उपरोक्त कमांड को निष्पादित करने पर, यह सभी हाइव कमांड की सूची के साथ फाइल को खोलेगा, जिसे निष्पादित करने की आवश्यकता है।



इस स्क्रिप्ट में, एक तालिका बनाई जाएगी, वर्णन किया जाएगा और डेटा लोड किया जाएगा और तालिका से पुनर्प्राप्त किया जाएगा।

1. हाइव में टेबल बनाना:

आदेश: तालिका उत्पाद (उत्पाद: इंट, उत्पाद नाम: स्ट्रिंग, मूल्य: फ्लोट, श्रेणी: स्ट्रिंग) पंक्तियाँ सीमांकित फ़ील्ड को term, 'द्वारा समाप्त किया गया

यहां, उत्पाद तालिका का नाम है और {productid, productname, मूल्य, श्रेणी} इस तालिका के कॉलम हैं।

‘द्वारा समाप्त किए गए फ़ील्ड, 'संकेत देते हैं कि इनपुट फ़ाइल में कॉलम प्रतीक the द्वारा अलग किए गए हैं,'।

डिफ़ॉल्ट रूप से इनपुट फ़ाइल में रिकॉर्ड एक नई लाइन द्वारा अलग किए जाते हैं।

2. तालिका का वर्णन:

आदेश: उत्पाद का वर्णन करें

3. तालिका में डेटा लोड हो रहा है।

डेटा को तालिका में लोड करने के लिए सबसे पहले हमें एक इनपुट फ़ाइल बनानी होगी, जिसमें ऐसे रिकॉर्ड हों, जिन्हें तालिका में सम्मिलित करने की आवश्यकता है।

चलिए एक इनपुट फाइल बनाते हैं।

आदेश: sudo gedit input.txt

फ़ाइल में सामग्री को संपादित करें जैसा कि चित्र में दिखाया गया है।

4. डेटा पुनर्प्राप्त करना:

डेटा को पुनः प्राप्त करने के लिए, चयन कमांड का उपयोग किया जाता है।

आदेश: उत्पाद से * का चयन करें

उपरोक्त आदेश का उपयोग तालिका में मौजूद सभी स्तंभों के मूल्य को पुनः प्राप्त करने के लिए किया जाता है। स्क्रिप्ट को वैसा ही होना चाहिए जैसा कि नीचे की छवि में दिखाया गया है।

अब, हम हाइव स्क्रिप्ट लिखने के साथ किया जाता है। फ़ाइल का नमूना .qql अब बचाया जा सकता है।

चरण 2: हाइव स्क्रिप्ट चला रहा है

निम्नलिखित हाइव स्क्रिप्ट चलाने के लिए कमांड है:

आदेश: hive -f /home/cloudera/sample.sql

c c ++ और जावा के बीच अंतर

स्क्रिप्ट निष्पादित करते समय, सुनिश्चित करें कि स्क्रिप्ट फ़ाइल के स्थान का पूरा पथ मौजूद है।

हम देख सकते हैं कि सभी कमांड सफलतापूर्वक निष्पादित किए जाते हैं।

यह कैसे हाइव स्क्रिप्ट्स CDH4 में चलाए और निष्पादित किए जाते हैं।

Hive, Hadoop का एक महत्वपूर्ण घटक है और Hive में आपकी विशेषज्ञता आपको शीर्ष-भुगतान वाले Hadoop की नौकरी दे सकती है! एडुर्का में एक विशेष रूप से क्यूरेटिड हडोप कोर्स है जो आपको मैप्रेड्यूस, यार्न, पिग, हाइव, HBase, Oozie, Flume और Sqoop जैसे मास्टर अवधारणाओं में मदद करता है। आरंभ करने के लिए नीचे दिए गए बटन पर क्लिक करें।

क्या आप हमसे कोई प्रश्न पूछना चाहते हैं? कृपया टिप्पणी अनुभाग में उनका उल्लेख करें और हम आपके पास वापस आ जाएंगे।

संबंधित पोस्ट:

हाइव कमांड्स

हाइव डेटा मॉडल