बिग डेटा और ईटीएल फैमिली है



इस ब्लॉग में, हम बिग डेटा और ईटीएल के बीच संबंध देखने जा रहे हैं। टैलेंड वह उपकरण है जिसका उपयोग बिग डेटा और ईटीएल को जोड़ने के लिए व्यापक रूप से किया जा रहा है।

बिग डेटा वास्तव में हाल के दिनों में पर्याप्त रूप से सम्मोहित किया गया है, इसलिए कुशल पेशेवर जो इसके ज्ञान के साथ आते हैं। अपने प्राथमिक कौशल का उपयोग नहीं करना और ग्राउंड ज़ीरो से शुरू करना हमेशा एक आसान काम नहीं है। हालांकि, अपने स्क्वायर कट्स का उपयोग करना और बाउंसरों के अनुकूल होने से आपके लिए चमत्कार होगा। बिंगो, हम ETL तकनीक का उपयोग करके बिग डेटा सीखने के बारे में बात कर रहे हैं।





ETL डेवलपर्स जो डेटा ट्रांसफ़ॉर्मेशन वर्कफ़्लोज़ डिज़ाइन करते हैं, वे बहुत अच्छी तरह से टूल का उपयोग कर सकते हैं और वर्कफ़्लोज़ को Hadoop नौकरियों में अनुवाद कर सकते हैं। Hadoop एक ओपन सोर्स फ्रेमवर्क है जिसका उपयोग बड़े पैमाने पर MapReduce प्रोग्राम (जो कि एक अन्य ओपन सोर्स टेक्नोलॉजी है जो Hadoop पर बड़ी मात्रा में डेटा प्रोसेस करने में मदद करता है) का उपयोग करने के लिए किया जाता है। अधिकांश समय, बिग डेटा में कुशल संसाधन ढूंढना चुनौतीपूर्ण हो सकता है।

अगर किसी ETL डेवलपर को बैंक की वेबसाइट पर एक लाख से अधिक अनुरोध करने वाले IP पते ढूंढने पड़ते हैं, तो उसे एक MapReduce job लिखना होगा, जो Hadoop में संग्रहीत वेब-लॉग डेटा को संसाधित करता है। हालांकि, ईटीएल प्रौद्योगिकी में उन्नति के साथ, एक नौकरी डेवलपर ईटीएल प्रवाह बनाने के लिए मानक ईटीएल डिजाइन टूल का उपयोग कर सकता है जो कि Hadoop (फ़ाइलें, Hive, HBase) में कई स्रोतों से डेटा पढ़ सकता है, सम्मिलित हो सकता है, फ़िल्टर कर सकता है और डेटा बदल सकता है। IP पते पर क्वेरी का उत्तर खोजने के लिए।



टैलेंड एकमात्र ग्राफिकल यूजर इंटरफेस टूल है जो एक ETL जॉब को MapReduce जॉब में 'ट्रांसलेट' करने में सक्षम है। इस प्रकार, टैलेंड ईटीएल नौकरी को हडोप पर मैपरेड की नौकरी के रूप में निष्पादित किया जाता है और मिनटों में किए गए बड़े डेटा काम को प्राप्त करता है। यह एक प्रमुख नवाचार है जो बिग डेटा प्रौद्योगिकी में प्रवेश बाधाओं को कम करने में मदद करता है और ईटीएल नौकरी डेवलपर्स (शुरुआती और उन्नत) को डेटा वेयरहाउस को अधिक से अधिक हद तक पूरा करने की अनुमति देता है।

बिग डेटा शहर में जीवन टैलेंड के आसपास बहुत आसान है

सी ++ में मर्ज करें

Hadoop अनुप्रयोगों के शीर्ष पर एक चित्रमय अमूर्त परत - यह बिग डेटा की दुनिया में जीवन को इतना आसान बनाता है।



टैलेंड का क्या कहना है: “ओपन सोर्स डेटा इंटीग्रेशन में एक इनोवेटर और लीडर के रूप में हमारे इतिहास को ध्यान में रखते हुए, टैलेंड पहला प्रोवाइडर है जो शुद्ध ओपन सोर्स सॉल्यूशन को सक्षम बनाता है। बड़ा डेटा एकीकरण । बिग डेटा के लिए ओपन स्टूडियो, शक्तिशाली Hadoop अनुप्रयोगों के शीर्ष पर ग्राफिकल विकास के वातावरण का उपयोग करने के लिए एक आसान बिछाने से, बनाता है बड़ा डेटा प्रबंधन पहले से कहीं अधिक कंपनियों और अधिक डेवलपर्स के लिए सुलभ।

अपने ग्रहण-आधारित चित्रमय कार्यक्षेत्र के साथ, बिग डेटा के लिए टैलेंड ओपन स्टूडियो डेवलपर और डेटा वैज्ञानिक को एचडीएफएस, एचबीएएस, हाइव और पिग जैसे Hadoop लोडिंग और प्रोसेसिंग तकनीकों का लाभ उठाने में सक्षम बनाता है। Hadoop आवेदन कोड। बस एक पैलेट से चित्रमय घटकों का चयन करके, उन्हें व्यवस्थित करने और कॉन्फ़िगर करने से, आप Hadoop नौकरियां बना सकते हैं। उदाहरण के लिए:

  1. HDFS में डेटा लोड करें (Hadoop वितरित फ़ाइल सिस्टम)
  2. प्रयोग करें Hadoop सुअर HDFS में डेटा को बदलने के लिए
  3. डेटा को एक में लोड करें Hadoop Hive आधारित डेटा वेयरहाउस
  4. हाइव में ईएलटी (अर्क, लोड, ट्रांसफॉर्म) एकत्रीकरण करें
  5. उत्तोलन सकप संबंधपरक डेटाबेस और Hadoop को एकीकृत करने के लिए

Hadoop Applications, Talend का उपयोग करके मिनटों के भीतर सहज एकीकृत।

Hadoop अनुप्रयोगों को आपके संगठन के लिए वास्तव में सुलभ होने के लिए, उन्हें आपके समग्र डेटा प्रवाह में सुचारू रूप से एकीकृत करने की आवश्यकता है। बिग डाटा के लिए टैलेंड ओपन स्टूडियो Hadoop अनुप्रयोगों को अपने व्यापक डेटा आर्किटेक्चर में एकीकृत करने के लिए आदर्श उपकरण है। टैलेंट किसी भी अन्य डेटा एकीकरण समाधान की तुलना में अधिक अंतर्निहित कनेक्टर घटक प्रदान करता है, अधिक से अधिक 800 कनेक्टर्स इससे किसी भी बड़े फ़ाइल प्रारूप, डेटाबेस या पैकेज्ड एंटरप्राइज़ एप्लिकेशन को पढ़ना या लिखना आसान हो जाता है। उदाहरण के लिए, बिग डेटा के लिए टैलेंड ओपन स्टूडियो में, आप डेटा एकीकरण प्रवाह बनाने के लिए ड्रैग 'एन ड्रॉप विन्यास योग्य घटकों का उपयोग कर सकते हैं जो सीमांकित लॉग फ़ाइलों से डेटा को Hadoop Hive में ले जाते हैं, Hive में कार्य करते हैं, और Hive से MySQL डेटाबेस में डेटा निकालते हैं। (या ओरेकल, साइबेस, एसक्यूएल सर्वर, और इसी तरह)।

यह देखना चाहते हैं कि अत्याधुनिक होडोप अनुप्रयोगों के साथ काम करना कितना आसान हो सकता है?

इंतजार करने की जरूरत नहीं - बिग डेटा के लिए टैलेंड ओपन स्टूडियो एक ओपन सोर्स सॉफ्टवेयर है, जो एक अपाचे लाइसेंस के तहत डाउनलोड और उपयोग करने के लिए मुफ्त है।

टाउन में बात करें

टैलेंड रहा है aडेटा एकीकरण उपकरण के लिए मैजिक क्वाड्रंट में दूरदर्शी2009 के बाद से। हाल ही में, वे डेटा क्वालिटी और एमडीएम क्षेत्र में अग्रणी के रूप में उभरे हैं और साथ ही एक शानदार बिग डेटा डिश पकाने के लिए सभी सामग्री।

उनका दावा है कि: 'बिग डेटा इंटीग्रेशन आपके संगठन में प्रदर्शन और मापनीयता को 45 प्रतिशत बढ़ा देता है'।

केवल टैलेंट 5.5 (और उच्चतर) डेवलपर्स को MapReduce या Pig में विशेषज्ञ होने की आवश्यकता के बिना उच्च प्रदर्शन Hadoop कोड उत्पन्न करने की अनुमति देता है।

कुछ महीने पहले, टैलेंड के एक लेख में कहा गया था: 'Hadoop का अडॉप्शन आसमान छू रहा है और कंपनियां बड़ी और छोटी हैं जो इस बढ़ती मांग को पूरा करने के लिए पर्याप्त जानकार Hadoop Developers को खोजने के लिए संघर्ष कर रही हैं'। केवल टैलेंट 5.5 किसी भी डेटा एकीकरण डेवलपर को मूल, उच्च प्रदर्शन और अत्यधिक स्केलेबल हडोप कोड उत्पन्न करने के लिए एक दृश्य विकास पर्यावरण का उपयोग करने की अनुमति देता है। यह विकास संसाधनों के एक बड़े पूल को अनलॉक करता है जो अब बड़ी डेटा परियोजनाओं में योगदान कर सकते हैं। इसके अलावा, टैलेंट हडोप में नए विकास की धार पर बना हुआ है, जो वास्तविक समय के ग्राहक इंटरैक्शन को बिजली देने के लिए बड़े डेटा एनालिटिक्स प्रोजेक्ट की अनुमति देता है।

बिग डेटा के लिए प्रतिभा विषम स्रोत प्रणालियों - जैसे तृतीय पक्ष, एपीआई और सोशल नेटवर्किंग फीड से डेटासेट एकत्र करके संगठनों को समझने में मदद कर सकती है - और उस डेटा को एंड-टू-एंड ग्राहक यात्रा के दृश्य चित्र में बदल सकती है।

यह बैंकिंग उद्योग, फार्मास्यूटिकल्स, ई-कॉमर्स, बीमा हो - टैलेंट किसी भी पैमाने पर डेटा को एक एकीकृत मिश्रण के साथ एकीकृत कर सकता है और वर्तमान और भविष्य की मांग को पूरा करने के लिए सबसे अत्याधुनिक तकनीक साबित हो सकता है।

दुनिया भर के मामलों का उपयोग करें

बैंकिंग उद्योग में विपणन अभियान से ग्राहक सेवा शुरू करने से लेकर धोखाधड़ी का पता लगाने तक, हर जगह बड़ा डेटा है।

अपने ओपन-सोर्स संस्करण में अकेले 800+ से अधिक कनेक्टर्स होने के बाद, यह किसी भी चीज़ से जुड़ने के लिए सबसे बड़ा व्यापक रूप से समर्थित प्लेटफ़ॉर्म होने का दावा करता है और सब कुछ ला सकता है।

कैसे जावास्क्रिप्ट में सरणी लंबाई खोजने के लिए

बदलते पैटर्न के साथ और NoSQL की ओर संरेखित, ओपन सोर्स, Hadoop, सीखने का विकल्प बिग डेटा और ETL शैली का उपयोग करके टैलेंड का उपयोग किसी भी रूप में और कभी भी डेटा के साथ व्यवहार करने वाले लोगों के लिए सबसे तार्किक निर्णय होगा।

सारांश में, ETL उपकरण पास होने से बहुत दूर हैं। वे बिग डेटा पारिस्थितिकी तंत्र के लिए केंद्रीय हैं और डेटा एनालिटिक्स को सक्षम करने में महत्वपूर्ण भूमिका निभाते हैं।

यही कारण है कि टैलेंड चमकता है '10 मिनट के अंदर, कोडिंग के बिना बिग डेटा के लिए शून्य'।

क्या आप हमसे कोई प्रश्न पूछना चाहते हैं? उन्हें टिप्पणी अनुभाग में उल्लेख करें और हम आपके पास वापस आ जाएंगे।

संबंधित पोस्ट: