Oozie ट्यूटोरियल: जानें कि कैसे अपने Hadoop जॉब शेड्यूल करें



Apache Oozie ट्यूटोरियल: Oozie Hadoop नौकरियों का प्रबंधन करने के लिए एक वर्कफ़्लो शेड्यूलर सिस्टम है। यह एक स्केलेबल, विश्वसनीय और एक्स्टेंसिबल सिस्टम है।

इस Apache Oozie ट्यूटोरियल को शुरू करने से पहले, आइए समझते हैं कि शेड्यूलर सिस्टम का उपयोग कहाँ किया जाता है। वास्तविक समय परिदृश्यों में, एक नौकरी अन्य नौकरियों पर निर्भर होती है, जैसे कि मैपआरड्यूस कार्य का उत्पादन आगे की प्रक्रिया के लिए हाइव नौकरी को पारित किया जा सकता है। अगला परिदृश्य दैनिक, साप्ताहिक, मासिक या डेटा उपलब्धता के आधार पर समय के आधार पर कार्य के एक सेट का समय निर्धारण हो सकता है। Apache Oozie आपको इस प्रकार के परिदृश्यों को आसानी से संभालने की शक्ति प्रदान करता है। यही कारण है कि Apache Oozie का एक महत्वपूर्ण हिस्सा है ।

इस Apache Oozie ट्यूटोरियल ब्लॉग में, हम शामिल होंगे:





  • अपाचे ऊज़ी परिचय
  • ओजी वर्कफ़्लो
  • ओजी कोऑर्डिनेटर
  • ऊजी बंडल
  • वर्ड काउंट वर्कफ्लो जॉब
  • समय-आधारित शब्द गणना समन्वयक नौकरी

हम Apache Oozie को पेश करके इस Oozie ट्यूटोरियल को शुरू करेंगे। फिर आगे बढ़ते हुए, हम उन प्रकार की नौकरियों को समझेंगे जो Apache Oozie का उपयोग करके बनाई और निष्पादित की जा सकती हैं।

Apache Oozie ट्यूटोरियल: Apache Oozie का परिचय

Apache Oozie - Oozie ट्यूटोरियल - एडुर्काApache Oozie एक वितरित वातावरण में Hadoop नौकरियों के प्रबंधन और निष्पादन के लिए एक अनुसूचक प्रणाली है। हम विभिन्न प्रकार के कार्यों के संयोजन के साथ एक वांछित पाइपलाइन बना सकते हैं। यह आपका Hive, Pig, Sqoop या MapReduce कार्य हो सकता है। Apache Oozie का उपयोग करके आप अपनी नौकरी भी शेड्यूल कर सकते हैं। कार्य के एक क्रम के भीतर, दो या अधिक नौकरियों को भी एक दूसरे के समानांतर चलाने के लिए प्रोग्राम किया जा सकता है। यह एक स्केलेबल, विश्वसनीय और एक्स्टेंसिबल सिस्टम है।



ओज़ी एक ओपन सोर्स जावा वेब-एप्लिकेशन है, जो वर्कफ़्लो क्रियाओं को ट्रिगर करने के लिए जिम्मेदार है। यह, बदले में, कार्यों को निष्पादित करने के लिए Hadoop निष्पादन इंजन का उपयोग करता है।

अपाचे Oozie कॉलबैक और मतदान के माध्यम से कार्यों के पूरा होने का पता लगाता है। जब Oozie एक कार्य शुरू करता है, तो यह कार्य को एक अद्वितीय कॉलबैक HTTP URL प्रदान करता है और कार्य पूरा होने पर उस URL को सूचित करता है। यदि कार्य कॉलबैक URL को लागू करने में विफल रहता है, तो Oozie कार्य को पूरा करने के लिए सर्वेक्षण कर सकता है।

Apache Oozie में तीन प्रकार की नौकरियां हैं:



  • ओजी वर्कफ़्लो जॉब्स & minus ये डायरेक्टेड एसाइक्लिक ग्राफ (डीएजी) हैं जो निष्पादित किए जाने वाले कार्यों का एक क्रम निर्दिष्ट करते हैं।
  • Oozie समन्वयक नौकरियां & minus; इनमें समय और डेटा की उपलब्धता से शुरू होने वाली वर्कफ़्लो नौकरियों से मिलकर बनता है।
  • ऊजी बंडलों & minus; इन्हें कई समन्वयक और वर्कफ़्लो नौकरियों के पैकेज के रूप में संदर्भित किया जा सकता है।

अब, इन सभी नौकरियों को एक-एक करके समझते हैं।

Apache Oozie ट्यूटोरियल: Oozie वर्कफ़्लो

वर्कफ़्लो एक डायरेक्ट एसाइक्लिक ग्राफ (DAG) में व्यवस्थित क्रियाओं का एक क्रम है। क्रियाएं एक दूसरे पर निर्भर हैं, क्योंकि अगली कार्रवाई केवल वर्तमान कार्रवाई के आउटपुट के बाद निष्पादित की जा सकती है। वर्कफ़्लो एक्शन एक पिग एक्शन, हाइव एक्शन, मेप्रेड्यूस एक्शन, शेल एक्शन, जावा एक्शन आदि हो सकता है। निर्णय लेने के लिए पेड़ हो सकते हैं कि कैसे और किस शर्त पर नौकरी चलनी चाहिए।

हम नौकरी के आधार पर विभिन्न प्रकार की कार्रवाइयां कर सकते हैं और प्रत्येक प्रकार की कार्रवाई के अपने प्रकार के टैग हो सकते हैं।वर्कफ़्लो और स्क्रिप्ट या जार वर्कफ़्लो को निष्पादित करने से पहले HDFS पथ में रखा जाना चाहिए।

sqlite ब्राउज़र क्या है

आदेश: oozie job -oozie http: // localhost: 11000 / oozie -config job.properties -run

नौकरी की स्थिति की जांच के लिए, आप ओज़ी वेब कंसोल पर जा सकते हैं, अर्थात। http: // host_name: 11000 । नौकरी पर क्लिक करके आप नौकरी की स्थिति देखेंगे।

परिदृश्यों में, जहाँ हम कई नौकरियों को समान रूप से चलाना चाहते हैं, हम उपयोग कर सकते हैं कांटा । जब भी हम कांटा का उपयोग करते हैं, तो हमें कांटे के रूप में एक अंत नोड के रूप में शामिल होना होगा। प्रत्येक कांटा के लिए एक सम्मिलित होना चाहिए। शामिल हों मान लें कि सभी नोड्स समान रूप से निष्पादित कर रहे हैं, एक एकल कांटा का बच्चा है। उदाहरण के लिए, हम समान रूप से एक ही समय में दो टेबल बना सकते हैं।

यदि हम निर्णय के आउटपुट के आधार पर कार्रवाई चलाना चाहते हैं, तो हम निर्णय टैग जोड़ सकते हैं। उदाहरण के लिए, यदि हमारे पास पहले से ही हाइव टेबल है, तो हमें इसे फिर से बनाने की आवश्यकता नहीं है। उस स्थिति में, यदि टेबल पहले से मौजूद है तो हम टेबल टेबल नहीं चलाने के लिए एक निर्णय टैग जोड़ सकते हैं। निर्णय नोड्स में स्विच केस के समान एक स्विच टैग होता है।

जॉब-ट्रैकर, नाम-नोड, स्क्रिप्ट और परम के मूल्य को सीधे पारित किया जा सकता है। लेकिन, इसे प्रबंधित करना कठिन हो जाता है। यह वह जगह है जहाँ एक कॉन्फ़िग फ़ाइल (यानी .property फ़ाइल) काम आती है।

Apache Oozie ट्यूटोरियल: Oozie समन्वयक

आप जटिल वर्कफ़्लोज़ और साथ ही वर्कफ़्लोज़ को शेड्यूल कर सकते हैं जो नियमित रूप से कोऑर्डिनेटर का उपयोग करके शेड्यूल किए जाते हैं। Oozie Coordinators समय, डेटा या घटना के आधार पर वर्कफ़्लोज़ नौकरियों को ट्रिगर करता है। कार्य समन्वयक के अंदर वर्कफ़्लो तब शुरू होता है जब दी गई स्थिति संतुष्ट होती है।

समन्वयक नौकरियों के लिए आवश्यक परिभाषाएँ हैं:

  • शुरू & minus; नौकरी के लिए डेटटाइम शुरू करें।
  • समाप्त नौकरी के लिए & minus; अंत डेटाइम
  • समय क्षेत्र समन्वयक आवेदन का & minus; टाइमजोन।
  • आवृत्ति & minus; आवृत्ति, कार्य निष्पादित करने के लिए मिनटों में।

कुछ और गुण नियंत्रण सूचना के लिए उपलब्ध हैं:

  • समय समाप्त & minus। अधिकतम समय, मिनटों में, जिसके लिए एक कार्रवाई अतिरिक्त शर्तों को पूरा करने से पहले, इंतजार करने से पहले ही समाप्त हो जाएगी। 0 इंगित करता है कि यदि सभी इनपुट इवेंट एक्शन मटीरियल के समय पर संतुष्ट नहीं होते हैं, तो एक्शन को तुरंत समाप्त कर देना चाहिए। -1 कोई टाइमआउट इंगित करता है, कार्रवाई हमेशा के लिए इंतजार करेगी। डीफॉल्ट मूल्य 1 है।
  • संगामिति & minus; नौकरी के लिए अधिकतम क्रियाएं जो समानांतर रूप से चल सकती हैं। डीफॉल्ट मूल्य 1 है।
  • निष्पादन - यह निष्पादन आदेश को निर्दिष्ट करता है यदि समन्वयक नौकरी के कई उदाहरणों ने उनके निष्पादन मानदंडों को संतुष्ट किया है। यह हो सकता है:
    • FIFO (डिफ़ॉल्ट)
    • LIFO
    • LAST_ONLY

आदेश: oozie job –oozie http: // localhost: 11000 / oozie -config -run

यदि समन्वयक नौकरी प्रस्तुत करते समय परिभाषा में उपयोग की जाने वाली कॉन्फ़िगरेशन संपत्ति नौकरी कॉन्फ़िगरेशन के साथ प्रदान नहीं की जाती है, तो नौकरी प्रस्तुत करना विफल हो जाएगा।

Apache Oozie ट्यूटोरियल: Oozie बंडल

Oozie बंडल सिस्टमआपको समन्वयक अनुप्रयोगों के एक सेट को परिभाषित करने और निष्पादित करने की अनुमति देता है, जिसे अक्सर डेटा पाइपलाइन कहा जाता है। एक ऑजी बंडल में, समन्वयक अनुप्रयोगों के बीच कोई स्पष्ट निर्भरता नहीं है। हालाँकि, आप एक अंतर्निहित डेटा अनुप्रयोग पाइपलाइन बनाने के लिए समन्वयक अनुप्रयोगों की डेटा निर्भरता का उपयोग कर सकते हैं।आप बंडल को शुरू / रोक / निलंबित / फिर से शुरू / फिर से कर सकते हैं। यह एक बेहतर और आसान परिचालन नियंत्रण देता है।

किक-ऑफ-टाइम & minus; वह समय जब एक बंडल शुरू होना चाहिए और समन्वयक अनुप्रयोगों को प्रस्तुत करना चाहिए।

इस अपाचे Oozie ट्यूटोरियल में आगे बढ़ते हुए, हम समझेंगे कि वर्कफ़्लो जॉब कैसे बनाया जाए।

Apache Oozie Tutorial: वर्ड काउंट वर्कफ़्लो जॉब

इस उदाहरण में, हम Apache Oozie का उपयोग करके एक शब्द गणना कार्य निष्पादित करने जा रहे हैं। यहां हम MapReduce word count program लिखने के बारे में चर्चा नहीं करेंगे। तो, इस Apache Oozie ट्यूटोरियल को फॉलो करने से पहले आपको इसे डाउनलोड करना होगा शब्द गणना जार फ़ाइल। अब, एक WordCountTest निर्देशिका बनाएँ जहाँ हम सभी फ़ाइलों को रखेंगे। जहाँ हम नीचे दी गई छवियों में दिखाए गए अनुसार शब्द गणना का स्थान बनाते हैं, वहां एक निर्देशिका बनाएँ।

अब, आगे बढ़ने और बनाने की सुविधा देता है job.properties और वर्कफ़्लो .xml फाइलें, जहां हम नौकरी और इससे जुड़े मापदंडों को निर्दिष्ट करेंगे।

job.properties

सबसे पहले, हम एक बना रहे हैं job.properties फ़ाइल, जहाँ हम NameNode और ResourceManager के मार्ग को परिभाषित कर रहे हैं। NameNode पथ वर्कफ़्लो निर्देशिका पथ को हल करने के लिए आवश्यक है और JobTracker पथ YARN को कार्य सबमिट करने में मदद करेगा। हमें इसका मार्ग प्रदान करने की आवश्यकता है वर्कफ़्लो .xml फ़ाइल, जिसे एचडीएफएस में संग्रहीत किया जाना चाहिए।

वर्कफ़्लो .xml

अगला, हमें बनाने की आवश्यकता है वर्कफ़्लो .xml फ़ाइल, जहां हम अपने सभी कार्यों को परिभाषित करेंगे और उन्हें निष्पादित करेंगे। सबसे पहले, हमें वर्कफ़्लो-ऐप का नाम निर्दिष्ट करना होगा यानी WorkflowRunnerTest । फिर, हम निर्दिष्ट कर रहे हैं नोड शुरू करें । प्रारंभ नोड () में है शुरू करें टैग ) वर्कफ़्लो नौकरी के लिए प्रवेश बिंदु है। यह पहले वर्कफ़्लो नोड की ओर इंगित करता है जहां से नौकरी शुरू होनी चाहिए। जैसा कि आप नीचे दी गई छवि में देख सकते हैं, अगला नोड है चौराहा ० जहां से नौकरी शुरू होगी।

इसके बाद, हम कार्य नोड में किए जाने वाले कार्य को निर्दिष्ट कर रहे हैं। हम यहां MapReduce WordCount कार्य निष्पादित कर रहे हैं। हमें इस MapReduce कार्य को निष्पादित करने के लिए आवश्यक कॉन्फ़िगरेशन निर्दिष्ट करने की आवश्यकता है। हम नौकरी ट्रैकर और NameNode पते को परिभाषित कर रहे हैं।

अगला तैयार तत्व है, जो विशेष रूप से डायरेक्ट्री क्लीनअप के लिए उपयोग किया जाता है, कार्रवाई को निष्पादित करने से पहले। यहां हम हटाने के लिए HDFS में डिलीट ऑपरेशन कर रहे हैं आउट 1 फ़ोल्डर अगर यह पहले से ही बनाया गया है। तैयारी टैग का उपयोग नौकरी निष्पादित करने से पहले एक फ़ोल्डर बनाने या हटाने के लिए किया जाता है। फिर हम MapReduce के गुणों को निर्दिष्ट कर रहे हैं जैसे नौकरी कतार नाम, मैपर क्लास, रिड्यूसर क्लास, आउटपुट की क्लास और आउटपुट क्लास।

अंतिम MapReduce कार्य कॉन्फ़िगरेशन HDFS में इनपुट और आउटपुट निर्देशिका है। इनपुट निर्देशिका है डेटा निर्देशिका, जो NameNode के रूट पथ में संग्रहीत है अंत में, हम मार तत्व को निर्दिष्ट करेंगे यदि नौकरी विफल हो जाती है।

अब हमें आगे बढ़ने की जरूरत है WordCountTest एचडीएफएस में फ़ोल्डर, जैसा कि हमने निर्दिष्ट किया है oozie.wf.application.path में संपत्ति job.properties फ़ाइल। तो, हम नकल कर रहे हैं WordCountTest Hadoop रूट निर्देशिका में फ़ोल्डर।

आदेश: हडूप fs -पुट वर्डकाउंटटेस्ट /

सत्यापित करने के लिए, आप NameNode वेब UI पर जा सकते हैं और जांच सकते हैं कि फ़ोल्डर को एचडीएफएस रूट डायरेक्टरी में अपलोड किया गया है या नहीं।

अब, हम वर्कफ़्लो कार्य को आगे बढ़ाने और निष्पादित करने के लिए पूरी तरह तैयार हैं।

आदेश: oozie job -oozie http: // localhost: 11000 / oozie -config job.properties -run

एक बार जब हम अपना काम पूरा कर लेते हैं तो हमें नौकरी की आईडी मिल जाती है (यानी 0000009-171219160449620-oozie-edur-W ) जैसा कि ऊपर चित्र में दिखाया गया है। आप जा सकते हैं और उस नौकरी की जांच कर सकते हैं जिसे आपने ओजी वेब यूआई में प्रस्तुत किया है अर्थात्। लोकलहोस्ट: 11000 । आप नीचे दी गई छवि में देख सकते हैं, हमने जो नौकरी प्रस्तुत की है वह नीचे सूचीबद्ध है।

यदि आप उपर्युक्त चित्र में देखेंगे, तो आपको जॉब आईडी, जॉब का नाम, जॉब की स्थिति, कार्य सबमिट करने वाला उपयोगकर्ता, निर्माण का समय, प्रारंभ और अंतिम संशोधन दिखाई देगा। अधिक जानकारी प्राप्त करने के लिए आप नौकरी पर क्लिक कर सकते हैं जैसे:

  • नौकरी की जानकारी

  • नौकरी की परिभाषा

  • नौकरी विन्यास

चूंकि नौकरी की स्थिति सफल होती है, इसलिए हमें एचडीएफएस रूट डायरेक्टरी में जाने और यह जांचने की जरूरत है कि आउटपुट डायरेक्टरी बनाई गई है या नहीं।

जैसा कि आप देख सकते हैं कि Oozieout HDFS में डायरेक्टरी बनाई गई है, तो अब जो आउटपुट फाइल बनाई गई है उस पर नजर डालते हैं।

जैसा कि हमने देखा है कि कैसे एक Oozie वर्कफ़्लो नौकरी बनाने के लिए, अब हम इस Apache Oozie ट्यूटोरियल ब्लॉग में आगे बढ़ेंगे और समझेंगे कि एक समन्वयक नौकरी कैसे बनाई जाए।

Apache Oozie Tutorial: टाइम बेस्ड वर्ड काउंट कोऑर्डिनेटर जॉब

इस उदाहरण में, हम एक समय-आधारित शब्द गणना समन्वयक कार्य का निर्माण करेंगे, जिसे एक विशिष्ट समय अंतराल के बाद निष्पादित किया जाएगा। आप Apache Oozie का उपयोग करके एक नौकरी बना और शेड्यूल कर सकते हैं जिसे दैनिक या समय-समय पर निष्पादित करने की आवश्यकता होती है।

आइए हम इस Apache Oozie ट्यूटोरियल में जल्दी से आगे बढ़ें और एक समन्वयक कार्य बनाएं। यहां हम तीन फाइलें बनाएंगे यानी समन्वयक , ordinator.xml और वर्कफ़्लो .xml फ़ाइल। फिर से, यहाँ हम w जगह देंगे तालमेल अंदर जार परिवाद निर्देशिका के रूप में नीचे की छवि में दिखाया गया है।

अब हम इन फाइलों को व्यक्तिगत रूप से देखते हैं। सबसे पहले, हम कोऑर्डिनेटर.प्रोटेक्ट्स फ़ाइल के साथ शुरू करेंगे।

यहां, हम उस आवृत्ति को निर्दिष्ट कर रहे हैं जिस पर वर्कफ़्लो निष्पादित किया जाएगा। फ्रीक्वेंसी हमेशा मिनटों में व्यक्त की जाती है। हमारे मामले में, इस समन्वयक कार्य को निर्दिष्ट समय के बीच हर घंटे में एक बार निष्पादित किया जाएगा। फ़्रीक्वेंसी का उपयोग आवधिक अंतरालों को पकड़ने के लिए किया जाता है, जिस पर डेटा सेट उत्पन्न होते हैं, और समन्वयक अनुप्रयोगों को चलाने के लिए निर्धारित किया जाता है।

मिनट, घंटे, दिनों और महीनों में आवृत्ति को परिभाषित करने के लिए निम्नलिखित प्रारूप का उपयोग करें:

$ {समन्वय: मिनट (इंट एन)} एन $ {समन्वय: मिनट (45)} -> 45
$ {समन्वय: घंटे (int n)} एन * 60 $ {समन्वय: घंटे (3)} -> 180
$ {समन्वय: दिन (int n)} परिवर्तनशील $ {समन्वय: दिन (2)} -> वर्तमान तिथि से 2 पूर्ण दिनों में मिनट
$ {समन्वय: महीने (इंट एन)} परिवर्तनशील $ {समन्वय: महीने (1)} -> वर्तमान तिथि से 1 पूर्ण महीने में मिनट

अगला, हम नौकरी की शुरुआत और अंत समय को परिभाषित कर रहे हैं जैसा कि ऊपर की छवि में दिखाया गया है। समय शुरू नौकरी के लिए आरंभिक जीवनकाल है & अंतिम समय नौकरी की अंतिम तिथि है।

इसके बाद, हम NameNode & ResourceManager url को निर्दिष्ट कर रहे हैं, जिसका उपयोग HDFS में वर्कफ़्लो.xml फ़ाइल को संदर्भित करने और क्रमशः YARN को जॉब सबमिट करने के लिए किया जाएगा। अंत में, हम वर्कफ़्लो.xml पथ निर्दिष्ट कर रहे हैं, जिसे हम HDFS में संग्रहीत करेंगे। हम उस एप्लिकेशन पथ को भी निर्दिष्ट करेंगे, जहाँ सभी फ़ाइलें और कार्यशील निर्देशिका संग्रहीत की जाएंगी।

दूसरी फाइल है ordinator.xml जहां हम उन सभी गुणों का उपयोग करेंगे, जिन्हें हमने निर्दिष्ट किया है समन्वयक फ़ाइल। अब, सबसे पहले, हम समन्वयक आवेदन के गुणों को निर्दिष्ट करेंगे अर्थात् नाम, आवृत्ति और टाइमज़ोन। अगला, हम एक-एक करके वर्कफ़्लो निर्दिष्ट करेंगे। यहाँ, हमारे पास केवल एक वर्कफ़्लो है। इसलिए, एक्शन एलिमेंट के अंदर हम वर्कफ़्लो एलिमेंट बनाएंगे, जहाँ हम एप्लीकेशन पाथ को निर्दिष्ट करेंगे।

इसके बाद, आगे बढ़ते हुए हमें बनाना होगा वर्कफ़्लो .xml फ़ाइल जहाँ हम कार्य निर्दिष्ट करेंगे। यह के समान है वर्कफ़्लो .xml फ़ाइल, जिसे हमने वर्कफ़्लो जॉब में बनाया है।

अब फिर से, हम इसे स्थानांतरित करेंगे WordCountTest_TimedBased निर्देशिका को एच.डी.एफ.एस.

कमान : हडूप fs -put WordCountTest_TimeBased /

अब, हम आगे बढ़ने और इस Oozie ट्यूटोरियल में इस समन्वयक नौकरी को निष्पादित करने के लिए तैयार हैं। आगे बढ़ते हैं और इसे निष्पादित करते हैं।

कमान : oozie job –oozie http: // localhost: 11000 / oozie -config समन्वयक।

इस समन्वयक नौकरी आईडी (यानी 0000010-171219160449620-oozie-edur-C) पर ध्यान दें। यह आपको Oozie Web UI में अपनी नौकरी को ट्रैक करने में मदद करेगा।

आप अपने कोऑर्डिनेटर जॉब्स टैब में सूचीबद्ध नौकरी को ओजी वेब यूआई में देख सकते हैं। वर्कफ़्लो नौकरी के समान हमारे पास नाम, स्थिति, उपयोगकर्ता, आवृत्ति, नौकरी का प्रारंभ और समाप्ति समय है। जब आप किसी विशेष नौकरी पर क्लिक करेंगे, तो आपको नौकरी का विवरण दिखाई देगा, जैसा कि नीचे दी गई छवियों में दिखाया गया है।

  • समन्वयक नौकरी की जानकारी

  • समन्वयक नौकरी की परिभाषा

जावा में धारावाहिक क्या है
  • समन्वयक नौकरी विन्यास

अब, जैसा कि हमने विभिन्न टैब के माध्यम से देखा है। हम एचडीएफएस रूट डायरेक्टरी पर वापस जाएंगे जहां आउटपुट फ़ोल्डर बनाया जाएगा। जैसा कि आप नीचे की छवि में देख सकते हैं, oozieTimeBasedout निर्देशिका बनाई गई है, जैसा कि हमने निर्दिष्ट किया है वर्कफ़्लो .xml फ़ाइल।

अब, हम निर्मित आउटपुट फ़ाइल पर एक नज़र डालते हैं।

मुझे उम्मीद है कि आपको यह Apache Oozie Tutorial ब्लॉग जानकारीपूर्ण लगा होगा। यदि आप अधिक जानने के इच्छुक हैं, तो आप इसके माध्यम से जा सकते हैं जो आपको बिग डेटा के बारे में बताता है और कैसे Hadoop बिग डेटा से संबंधित चुनौतियों को हल कर रहा है।

अब जब आप Apache Oozie को समझ गए हैं, तो देखें 250,000 से अधिक संतुष्ट शिक्षार्थियों के एक नेटवर्क के साथ एक विश्वसनीय ऑनलाइन शिक्षण कंपनी, एडुरेका द्वारा, दुनिया भर में फैली हुई है। Edureka Big Data Hadoop सर्टिफिकेशन ट्रेनिंग कोर्स शिक्षार्थियों को रिटेल, सोशल मीडिया, एविएशन, टूरिज्म, फाइनेंस डोमेन पर रियल-टाइम उपयोग के मामलों का उपयोग करके HDFS, यार्न, MapReduce, Pig, Hive, HBase, Oozie, Flume और Sqoop में निपुण बनने में मदद करता है।

क्या आप हमसे कोई प्रश्न पूछना चाहते हैं? कृपया टिप्पणी अनुभाग में इसका उल्लेख करें और हम आपके पास वापस आ जाएंगे।