मस्त होदोप? अपाचे स्पार्क के साथ आरंभ करने का समय



इस ब्लॉग पोस्ट में बताया गया है कि क्यों आपको Hadoop के बाद Apache Spark से शुरुआत करनी चाहिए और क्यों Hadoff में महारत हासिल करने के बाद Spark सीखना आपके करियर के लिए चमत्कार कर सकता है!

Hadoop, जैसा कि हम सभी जानते हैं कि बड़े डेटा का पोस्टर बॉय है। एक सॉफ्टवेयर ढांचे के रूप में डेटा के हाथी के अनुपात को संसाधित करने में सक्षम है, Hadoop ने CIO buwords के शीर्ष पर अपनी जगह बना ली है।





हालाँकि, इन-मेमोरी स्टैक के अभूतपूर्व उदय ने एनालिटिक्स के बड़े डेटा इकोसिस्टम को एक नए विकल्प के लिए पेश किया है। एनालिटिक्स के MapReduce तरीके को एक नए दृष्टिकोण से प्रतिस्थापित किया जा रहा है जो कि Hadoop ढांचे के भीतर और उसके बाहर दोनों एनालिटिक्स की अनुमति देता है। Apache Spark बड़े डेटा एनालिटिक्स का ताज़ा नया चेहरा है।

बड़े डेटा उत्साही लोगों ने अपाचे स्पार्क को दुनिया में बड़े डेटा के लिए सबसे हॉट डेटा गणना इंजन के रूप में प्रमाणित किया है। यह तेजी से अपने पदों से MapReduce और Java को खारिज कर रहा है, और नौकरी के रुझान इस बदलाव को दर्शा रहे हैं। TypeSafe के एक सर्वेक्षण के अनुसार, 71% वैश्विक जावा डेवलपर्स वर्तमान में स्पार्क के आसपास का मूल्यांकन या शोध कर रहे हैं, और उनमें से 35% ने पहले ही इसका उपयोग करना शुरू कर दिया है। स्पार्क विशेषज्ञ वर्तमान में मांग में हैं, और पालन करने के लिए हफ्तों में, स्पार्क से संबंधित नौकरी के अवसरों की संख्या केवल छत से गुजरने की उम्मीद है।



तो, यह अपाचे स्पार्क के बारे में क्या है जो इसे हर सीआईओ के टू-डू सूची में सबसे ऊपर दिखाई देता है?

उदाहरणों के साथ pl sql ट्यूटोरियल

यहाँ अपाचे स्पार्क की कुछ दिलचस्प विशेषताएं हैं:

  • Hadoop एकीकरण - स्पार्क एचडीएफएस में संग्रहित फाइलों के साथ काम कर सकता है।
  • स्पार्क का इंटरएक्टिव शेल - स्पार्क को स्काला में लिखा गया है, और स्काला दुभाषिया का अपना संस्करण है।
  • स्पार्क का एनालिटिक सूट - स्पार्क इंटरैक्टिव क्वेरी विश्लेषण, बड़े पैमाने पर ग्राफ प्रसंस्करण और विश्लेषण और वास्तविक समय विश्लेषण के लिए उपकरणों के साथ आता है।
  • लचीला वितरित डेटासेट (RDDs) - RDD को उन वस्तुओं को वितरित किया जाता है, जिन्हें कंप्यूट नोड्स के क्लस्टर में, मेमोरी में कैश्ड किया जा सकता है। वे स्पार्क में प्रयुक्त प्राथमिक डेटा ऑब्जेक्ट हैं।
  • वितरित संचालक - MapReduce के अलावा, कई अन्य ऑपरेटर हैं जो RDD के उपयोग कर सकते हैं।

नासा, याहू और एडोब जैसे संगठनों ने स्पार्क के लिए खुद को प्रतिबद्ध किया है। डाटैब्रिक्स में जॉन ट्रिपियर, एलायन्स एंड इकोसिस्टम लीड का यही कहना है, 'बड़े और छोटे व्यवसायों द्वारा अपाचे स्पार्क को अपनाने से उद्योगों की एक विस्तृत श्रृंखला में अविश्वसनीय दर से विकास हो रहा है, और प्रमाणित विशेषज्ञता के लिए डेवलपर्स की मांग जल्दी है। निम्नलिखित झगड़ा'। अगर आपके पास Hadoop में बैकग्राउंड है, तो Learn Spark का बेहतर समय कभी नहीं रहा।



एडुर्का ने विशेष रूप से अपाचे स्पार्क और स्काला पर एक पाठ्यक्रम तैयार किया है, जो वास्तविक जीवन के उद्योग चिकित्सकों द्वारा सह-निर्मित है। उद्योग-संबंधित परियोजनाओं के साथ एक अलग लाइव ई-लर्निंग अनुभव के लिए, हमारे पाठ्यक्रम की जाँच करें। नए बैच जल्द ही शुरू हो रहे हैं, इसलिए यहां पाठ्यक्रम देखें:

क्या आप हमसे कोई प्रश्न पूछना चाहते हैं? कृपया टिप्पणी अनुभाग में इसका उल्लेख करें और हम आपके पास वापस आ जाएंगे।

संबंधित पोस्ट:

जावा उदाहरण में xml फ़ाइल पढ़ें

अपाचे स्पार्क बनाम हडोप मैपराइड