मस्त होदोप? APACHE SPARK से शुरुआत करने का समय | एडुर्का ब्लॉग

Hadoop, जैसा कि हम सभी जानते हैं कि बड़े डेटा का पोस्टर बॉय है। एक सॉफ्टवेयर ढांचे के रूप में डेटा के हाथी के अनुपात को संसाधित करने में सक्षम है, Hadoop ने CIO buwords के शीर्ष पर अपनी जगह बना ली है।

हालाँकि, इन-मेमोरी स्टैक के अभूतपूर्व उदय ने एनालिटिक्स के बड़े डेटा इकोसिस्टम को एक नए विकल्प के लिए पेश किया है। एनालिटिक्स के MapReduce तरीके को एक नए दृष्टिकोण से प्रतिस्थापित किया जा रहा है जो कि Hadoop ढांचे के भीतर और उसके बाहर दोनों एनालिटिक्स की अनुमति देता है। Apache Spark बड़े डेटा एनालिटिक्स का ताज़ा नया चेहरा है।

बड़े डेटा उत्साही लोगों ने अपाचे स्पार्क को दुनिया में बड़े डेटा के लिए सबसे हॉट डेटा गणना इंजन के रूप में प्रमाणित किया है। यह तेजी से अपने पदों से MapReduce और Java को खारिज कर रहा है, और नौकरी के रुझान इस बदलाव को दर्शा रहे हैं। TypeSafe के एक सर्वेक्षण के अनुसार, 71% वैश्विक जावा डेवलपर्स वर्तमान में स्पार्क के आसपास का मूल्यांकन या शोध कर रहे हैं, और उनमें से 35% ने पहले ही इसका उपयोग करना शुरू कर दिया है। स्पार्क विशेषज्ञ वर्तमान में मांग में हैं, और पालन करने के लिए हफ्तों में, स्पार्क से संबंधित नौकरी के अवसरों की संख्या केवल छत से गुजरने की उम्मीद है।

तो, यह अपाचे स्पार्क के बारे में क्या है जो इसे हर सीआईओ के टू-डू सूची में सबसे ऊपर दिखाई देता है?

उदाहरणों के साथ pl sql ट्यूटोरियल

यहाँ अपाचे स्पार्क की कुछ दिलचस्प विशेषताएं हैं:

Hadoop एकीकरण - स्पार्क एचडीएफएस में संग्रहित फाइलों के साथ काम कर सकता है।
स्पार्क का इंटरएक्टिव शेल - स्पार्क को स्काला में लिखा गया है, और स्काला दुभाषिया का अपना संस्करण है।
स्पार्क का एनालिटिक सूट - स्पार्क इंटरैक्टिव क्वेरी विश्लेषण, बड़े पैमाने पर ग्राफ प्रसंस्करण और विश्लेषण और वास्तविक समय विश्लेषण के लिए उपकरणों के साथ आता है।
लचीला वितरित डेटासेट (RDDs) - RDD को उन वस्तुओं को वितरित किया जाता है, जिन्हें कंप्यूट नोड्स के क्लस्टर में, मेमोरी में कैश्ड किया जा सकता है। वे स्पार्क में प्रयुक्त प्राथमिक डेटा ऑब्जेक्ट हैं।
वितरित संचालक - MapReduce के अलावा, कई अन्य ऑपरेटर हैं जो RDD के उपयोग कर सकते हैं।

नासा, याहू और एडोब जैसे संगठनों ने स्पार्क के लिए खुद को प्रतिबद्ध किया है। डाटैब्रिक्स में जॉन ट्रिपियर, एलायन्स एंड इकोसिस्टम लीड का यही कहना है, 'बड़े और छोटे व्यवसायों द्वारा अपाचे स्पार्क को अपनाने से उद्योगों की एक विस्तृत श्रृंखला में अविश्वसनीय दर से विकास हो रहा है, और प्रमाणित विशेषज्ञता के लिए डेवलपर्स की मांग जल्दी है। निम्नलिखित झगड़ा'। अगर आपके पास Hadoop में बैकग्राउंड है, तो Learn Spark का बेहतर समय कभी नहीं रहा।

एडुर्का ने विशेष रूप से अपाचे स्पार्क और स्काला पर एक पाठ्यक्रम तैयार किया है, जो वास्तविक जीवन के उद्योग चिकित्सकों द्वारा सह-निर्मित है। उद्योग-संबंधित परियोजनाओं के साथ एक अलग लाइव ई-लर्निंग अनुभव के लिए, हमारे पाठ्यक्रम की जाँच करें। नए बैच जल्द ही शुरू हो रहे हैं, इसलिए यहां पाठ्यक्रम देखें: ।

क्या आप हमसे कोई प्रश्न पूछना चाहते हैं? कृपया टिप्पणी अनुभाग में इसका उल्लेख करें और हम आपके पास वापस आ जाएंगे।

संबंधित पोस्ट:

जावा उदाहरण में xml फ़ाइल पढ़ें

अपाचे स्पार्क बनाम हडोप मैपराइड

मस्त होदोप? अपाचे स्पार्क के साथ आरंभ करने का समय

श्रेणियाँ

Popular Articles

जावास्क्रिप्ट रेगेक्स - महत्वपूर्ण नियमित अभिव्यक्तियाँ आपको जानना आवश्यक है

QlikView ट्यूटोरियल: QlikView के क्लिक-विज़ुअलाइज़ेशन की शक्ति को समझें

वेब ब्राउजर पर जावास्क्रिप्ट को कैसे निष्क्रिय करें?

कोटलिन नेटिव के साथ कैसे काम करें?

Java में Shallow Copy और Deep Copy कैसे लागू करें

डेटा वैज्ञानिक और डेटा विश्लेषक के बीच अंतर

शुरुआती के लिए SSIS ट्यूटोरियल: क्यों, क्या और कैसे?

स्प्लंक नॉलेज ऑब्जेक्ट्स: स्प्लंक इवेंट्स, इवेंट टाइप्स एंड टैग

Java में Merge Sort कैसे करें?

Java में Wait और Notify क्या है?

Apache Sqoop Tutorial - HDFS और RDBMS के बीच आयात / निर्यात डेटा

Informatica ट्यूटोरियल: अनौपचारिक रूप से समझना ’इनसाइड आउट’