पायथन सीबोर्न ट्यूटोरियल: सीबॉर्न क्या है और इसका उपयोग कैसे करें?

समुद्री और मैटलोट्लिब के बीच अंतर के साथ पायथन सीबोर्न ट्यूटोरियल। समुद्र में उपलब्ध विभिन्न कार्यों के अनुकूलन के बारे में भी जानें।

अजगर कई बेहद शक्तिशाली पुस्तकालयों और चौखटों का भंडार है। उनमें से, है सीबोर्न, जो एक प्रमुख है डेटा विज़ुअलाइज़ेशन पुस्तकालय, प्रोग्रामर को पूरा करने के लिए एक और कारण प्रदान करना । इस पायथन सीबोर्न ट्यूटोरियल में, आप सीबोर्न का उपयोग करके डेटा विज़ुअलाइज़ेशन के सभी नैक को झुका देंगे।

आगे बढ़ने से पहले, इस लेख में चर्चा के सभी विषयों पर नज़र डालते हैं:





तो आइए सबसे पहले पायथन सीबोर्न के महत्व को तर्क देकर शुरू करते हैं।

xml और html में क्या अंतर है

पायथन सीबोर्न का उपयोग क्यों करें?

जैसा कि पहले उल्लेख किया गया है, पायथन सीबोर्न लाइब्रेरी का उपयोग डेटा विज़ुअलाइज़ेशन के चुनौतीपूर्ण कार्य को आसान बनाने के लिए किया जाता है और यह आधारित है । सीबोर्न निम्नलिखित कार्यात्मकताओं के माध्यम से सांख्यिकीय ग्राफिक्स के निर्माण की अनुमति देता है:



  • एक एपीआई जो कई के बीच तुलना की अनुमति डेटासेट पर आधारित है चर

  • मल्टी-प्लॉट ग्रिड का समर्थन करता है जो बदले में जटिल विज़ुअलाइज़ेशन बनाने में आसानी करता है

  • डेटा के सबसेट के बीच तुलना करने के लिए उपलब्ध यूनीवेरिएट और बिवरिएट विज़ुअलाइज़ेशन



  • विभिन्न प्रकार के पैटर्न को प्रकट करने के लिए विभिन्न रंग पट्टियों की उपलब्धता

  • अनुमान और भूखंड खुद ब खुद

तो, अगर आप सोच रहे थे कि जब आप पहले से ही माटप्लोटलिब है तो सीबॉर्न का उपयोग क्यों करें, इसका जवाब यहां दिया गया है।

पाइथन सीबॉर्न बनाम मैटलोट्लिब:

'अगर माटप्लोटलिब' आसान चीजों को आसान और कठिन चीजों को संभव बनाने की कोशिश करता है ', तो सीबॉर्न हार्ड चीजों के एक अच्छी तरह से परिभाषित सेट को भी आसान बनाने की कोशिश करता है' - माइकल वास्कोम (सीबर्न का निर्माता)।
वास्तव में, माटप्लोटलिब अच्छा है लेकिन सीबॉर्न बेहतर है। मूल रूप से मेटप्लोटलिब की दो कमियाँ हैं जिन्हें सीबोर्न ठीक करता है:

  1. Matplotlib व्यक्तिगत हो सकता है लेकिन यह पता लगाना मुश्किल है कि भूखंडों को अधिक आकर्षक बनाने के लिए किन सेटिंग्स की आवश्यकता है। दूसरी ओर, सीबॉर्न इस मुद्दे को हल करने के लिए कई अनुकूलित विषयों और उच्च-स्तरीय इंटरफेस के साथ आता है।

  2. जब साथ काम कर रहा हो पंडों को , जब डेटाफ़्रेम से निपटने की बात आती है, तो मेटप्लोटिब अच्छी तरह से काम नहीं करता है, जबकि सीबॉर्न फ़ंक्शंस वास्तव में डेटाफ़्रेम पर काम करते हैं।

सीबॉर्न कैसे स्थापित करें?

पायथन सीबोर्न लाइब्रेरी को स्थापित करने के लिए, आप अपने द्वारा उपयोग किए गए प्लेटफ़ॉर्म के आधार पर निम्न आदेशों का उपयोग कर सकते हैं:

पाइप स्थापित करें

या

conda स्थापित समुद्री

एक बार यह स्थापित हो जाने के बाद, केवल उन पैकेजों और पुस्तकालयों को स्थापित करना सुनिश्चित करें जिन पर सीबोर्न निर्भर है।

पायथन Seaborn निर्भरता स्थापित करना:

समुद्री जीवों के लिए अनिवार्य निर्भरताएँ हैं:

एक सिफारिश की निर्भरता है जो है:

  • राज्य मॉडल

इन पुस्तकालयों को स्थापित करने के लिए, आप उसी आदेश का उपयोग कर सकते हैं जैसा कि सीबोर्न के लिए पहले उनके संबंधित नामों के साथ दिखाया गया है। एक बार स्थापित होने के बाद, उन्हें आसानी से आयात किया जा सकता है। सीबोर्न आपको किसी भी डेटासेट को लोड करने की अनुमति देता है का उपयोग load_dataset () समारोह। आप get_dataset_names () फ़ंक्शन का उपयोग करके सभी उपलब्ध डेटासेट भी देख सकते हैं:

उदाहरण:

snsget_dataset_names () के रूप में आयात सीबोनल

यह सभी उपलब्ध डेटासेट की सूची लौटाएगा।
अब जब आपने सीबोर्न के साथ काम करने के लिए अपना वातावरण स्थापित कर लिया है, तो चलिए आगे देखते हैं कि इसे कैसे प्लॉटिंग फ़ंक्शन का उपयोग करना है ।

सीबोनल प्लॉटिंग फ़ंक्शंस

दृश्य सांख्यिकीय संबंध:

डेटासेट के वैरिएबल और इन रिश्तों के बीच संबंधों को समझने की प्रक्रिया, बदले में, अन्य वैरिएबल पर निर्भर करती है, जिसे सांख्यिकीय विश्लेषण के रूप में जाना जाता है। आइए अब इसके लिए आवश्यक कार्यों पर एक गहरी नज़र डालें:

रेलप्लॉट ():

यह एक आंकड़ा-स्तर-फ़ंक्शन है जो सांख्यिकीय संबंधों को विज़ुअलाइज़ करने के लिए दो अन्य अक्षों का उपयोग करता है जो हैं:

  • स्कैटर प्लॉट()
  • लाइन प्लॉट()

इन कार्यों को रिलेप्लेट () के 'तरह' पैरामीटर का उपयोग करके निर्दिष्ट किया जा सकता है। यदि यह पैरामीटर दिया जाता है, तो यह डिफ़ॉल्ट होता है जो स्कैटलप्लॉट () है। अपना कोड लिखना शुरू करने से पहले, आवश्यक पुस्तकालयों को निम्नानुसार आयात करना सुनिश्चित करें:

आयात एनपीपी आयात के रूप में एनपीपी आयात के रूप में पीडी आयात matplotlib.pyplot के रूप में plt आयात सीबो के रूप में एसएनएस snsset (शैली = 'darkgrid')

कृपया ध्यान दें कि शैली विशेषता भी अनुकूलन योग्य है और किसी भी मूल्य जैसे कि डार्कग्रिड, टिक्स आदि को ले सकती है, जिसकी चर्चा मैं बाद में प्लॉट-सौंदर्यशास्त्र खंड में करूंगा। आइए अब एक छोटा सा उदाहरण देखें:

उदाहरण:

f = sns.load_dataset ('उड़ानें') sns.relplot (x = 'यात्री', y = 'महीना', डेटा = f)

OUTPUT:

उड़ानें 1-पायथन सीबोर्न ट्यूटोरियल-एडुरका

जैसा कि आप देख सकते हैं, अंक 2-आयामों में प्लॉट किए गए हैं। हालाँकि, आप sem hue 'शब्दार्थ का उपयोग करके एक और आयाम जोड़ सकते हैं। आइए उसी का एक उदाहरण देखें:

उदाहरण:

f = sns.load_dataset ('उड़ानें') sns.relplot (x = 'यात्रियों', y = 'महीना', hue = 'वर्ष', डेटा = f)

आप निम्न आउटपुट देखेंगे:

OUTPUT:

हालाँकि, कई और अनुकूलन हैं जिन्हें आप आज़मा सकते हैं जैसे कि रंग, शैली, आकार, आदि। मुझे सिर्फ यह दिखाना है कि आप निम्न उदाहरण में रंग कैसे बदल सकते हैं:

उदाहरण:

sns.set (शैली = 'darkgrid') f = sns.load_dataset ('उड़ानें') sns.relplot (x = 'यात्री', y = 'महीना', ह्यू = 'वर्ष', पैलेट = 'ch': r = - .5, l = .75 ', डेटा = एफ)

OUTPUT:

लाइन प्लॉट():

यह फ़ंक्शन आपको अपने डेटा के लिए एक सतत रेखा खींचने की अनुमति देगा। आप इस फ़ंक्शन का उपयोग निम्न प्रकार से 'प्रकार' पैरामीटर बदलकर कर सकते हैं:

उदाहरण:

a = pd.DataFrame ({'Day': [1,2,3,4,5,6,7], 'किराने': [30,80,45,23,51,46,76], 'कपड़े' : [13,40,34,23,54,67,98], 'बर्तन': [12,32,27,56,87,54,34]}, सूचकांक = [1,2,3,4,5 , 6,7]) g = sns.relplot (x = 'Day', y = 'कपड़े', kind = 'line', data = a) g.fig.autofmt_xdate ()

OUTPUT:

लाइनप्लॉट के लिए डिफ़ॉल्ट x के एक फ़ंक्शन के रूप में y है। हालाँकि, यदि आप ऐसा करना चाहते हैं तो इसे बदला जा सकता है। कई और विकल्प हैं जिन्हें आप आगे आज़मा सकते हैं।

अब एक नजर डालते हैं कि कैसे स्पष्ट डेटा को प्लॉट किया जाए।

श्रेणीबद्ध डेटा के साथ प्लॉटिंग:

यह दृष्टिकोण चित्र में आता है जब हमारा मुख्य चर असतत समूहों (श्रेणीबद्ध) में विभाजित होता है। यह कैटलपॉट () फ़ंक्शन का उपयोग करके प्राप्त किया जा सकता है।

catplot ():

यह एक आंकड़ा-स्तर-फ़ंक्शन है जैसे कि रिलेप्लॉट ()। इसे कुल्हाड़ियों के तीन परिवारों द्वारा विशेषता प्रदान की जा सकती है:

  1. स्कैटरप्लॉट्स - इनमें स्ट्रिप्लॉट (), स्वार्मप्लॉट () शामिल हैं

    जावा बीन क्या है
  2. वितरण भूखंड - जो बॉक्सप्लॉट (), वायलिनप्लॉट (), बॉक्सनप्लॉट () हैं

  3. एस्टीमप्लॉट्स - क्रमशः पॉइंटप्लॉट (), बारप्लॉट (), काउंटप्लॉट ()

इसे प्रदर्शित करने के लिए अब कुछ उदाहरण लेते हैं:

उदाहरण:

आयात सीबोनल के रूप में एसएनएस आयात matplotlib.pyplot plt sns.set (स्टाइल = 'टिक', color_codes = True) a = sns.load_dataset ('टिप्स') sns.catplot (x = 'day', y = 'total_bill') के रूप में आयात करता है। data = a)

OUTPUT:

जैसा कि आप देख सकते हैं, उपरोक्त उदाहरण में मैंने parameter तरह ’का पैरामीटर सेट नहीं किया है। इसलिए इसने डिफ़ॉल्ट स्कैप्लेट के रूप में ग्राफ को वापस कर दिया है। आप जरूरत के अनुसार ग्राफ को बदलने के लिए अक्ष स्तर के किसी भी फ़ंक्शन को निर्दिष्ट कर सकते हैं। आइए इसका एक उदाहरण लें:

उदाहरण:

आयात सीबोनल के रूप में एसएनएस आयात matplotlib.pyplot plt sns.set (स्टाइल = 'टिक', color_codes = True) a = sns.load_dataset ('टिप्स') sns.catplot (x = 'day', y = 'total_bill') के रूप में आयात करता है। तरह = 'वायलिन', डेटा = ए)

OUTPUT:

उपरोक्त आउटपुट टिप्स डेटासेट के लिए वायलिनप्लॉट दिखाता है। अब हम यह पता लगाने की कोशिश करते हैं कि डेटासेट के वितरण की कल्पना कैसे करें।

डेटासेट के वितरण की कल्पना:

यह मूल रूप से डेटासेट को समझने के साथ संबंधित है जो कि अविभाज्य या द्विभाजित है। इसे शुरू करने से पहले, बस निम्नलिखित आयात करें:

np आयात ppas के रूप में सुन्न आयात pd आयात सीबॉर्न के रूप में, sns आयात matplotlib.pyplot के रूप में scipy आयात आँकड़े plsset से plt के रूप में (color_codes = True)

एक बार यह पूरा हो जाने के बाद, आप एकतरफा और द्विभाजित वितरण जारी रख सकते हैं।

अविभाजित वितरण प्लॉटिंग:

उन्हें प्लॉट करने के लिए, आप डिस्टलॉट () फ़ंक्शन का उपयोग निम्नानुसार कर सकते हैं:

उदाहरण:

a = np.random.normal (loc = 5, size = 100, scale = 2) sns.distplot (a)

OUTPUT:

जैसा कि आप ऊपर के उदाहरण में देख सकते हैं, हमने चर के लिए एक ग्राफ तैयार किया है, जिसके मान डिस्टर्बट का उपयोग करके सामान्य () फ़ंक्शन द्वारा उत्पन्न होते हैं।

प्लॉटिंग बिवरेट वितरण:

यह तस्वीर में आता है जब आपके पास दो यादृच्छिक स्वतंत्र चर होते हैं जिसके परिणामस्वरूप कुछ संभावित घटना होती है। इस प्रकार के ग्राफ को प्लॉट करने के लिए सबसे अच्छा कार्य है ज्वाइंटप्लेट ()। अब संयुक्त युग्मक () का उपयोग कर एक द्विभाजित ग्राफ की साजिश करते हैं।

उदाहरण:

जावा एल्गोरिदम और डेटा संरचनाएं
x = pd.DataFrame ({'Day': [1,2,3,4,5,6,7], 'किराने': [30,80,45,23,51,46,76], 'कपड़े' : [13,40,34,23,54,67,98], 'बर्तन': [12,32,27,56,87,54,34]}, सूचकांक = [1,2,3,4,5 , 6,7]) y = pd.DataFrame ({'दिन': [8,9,10,11,12,13,14], 'किराने': [30,80,45,23,51,46,] 76], 'कपड़े': [13,40,34,23,54,67,98], 'बर्तन': [12,32,27,56,87,54,34]}, सूचकांक = [8,9 , 10,11,12,13,14]) माध्य, cov = [0, 1], [(1, 2),, (.5, 1)] data = np.random.multivariate_normal (माध्य, cov, 200) ) sns.axes_style ('सफेद') के साथ: sns.jointplot (x = x, y = y, kind = 'kde', color = 'b')

OUTPUT:

अब जब आप पायथन सीबोर्न के विभिन्न कार्यों को समझ गए हैं, तो संरचित मल्टी-प्लॉट ग्रिड बनाने के लिए आगे बढ़ें।

बहु-प्लॉट ग्रिड:

पायथन सीबोर्न आपको कई ग्रिड्स को साइड-बाय करने की अनुमति देता है। ये मूल रूप से प्लॉट या ग्राफ़ हैं जो उनके बीच तुलना करने के लिए एक ही पैमाने और कुल्हाड़ियों का उपयोग करके प्लॉट किए जाते हैं। यह बदले में, प्रोग्रामर को भूखंडों के बीच जल्दी से अंतर करने और बड़ी मात्रा में जानकारी प्राप्त करने में मदद करता है।

इन रेखांकन को प्लॉट करने के लिए facetgrid () फ़ंक्शन के निम्नलिखित उदाहरण पर विचार करें।

उदाहरण:

sns.set (शैली = 'darkgrid') a = sns.load_dataset ('iris') b = sns.FacetGrid (a, col = 'प्रजातियों') b.map (plt.hist, 'sepal_length')

OUTPUT:

उपरोक्त आउटपुट स्पष्ट रूप से लंच और डिनर के दौरान दिए गए सुझावों के बीच तुलना को दर्शाता है। जब आप तुलना करने के लिए चर की एक जोड़ी है, तो आप PairGrid फ़ंक्शन का उपयोग करके भी प्लॉट कर सकते हैं। निम्नलिखित उदाहरण पर विचार करें।

उदाहरण:

sns.set (शैली = 'टिक') a = sns.load_dataset ('उड़ानें') b = sns.PairGrid (a) b.map (plt.scatter)

OUTPUT:

जैसा कि आप देख सकते हैं, उपरोक्त आउटपुट स्पष्ट रूप से विभिन्न तरीकों से वर्ष और यात्रियों की संख्या के बीच तुलना करता है।

Seaborn भी सौंदर्यशास्त्र के बारे में अनुकूलन की अनुमति देता है जिस पर आगे चर्चा की गई है।

प्लॉट-सौंदर्यशास्त्र:

पायथन सीबोर्न ट्यूटोरियल का यह खंड हमारे भूखंडों को अधिक आकर्षक और आनंदमय बनाने से संबंधित है।

पायथन सीबोर्न चित्रा-सौंदर्यशास्त्र:

पहला फ़ंक्शन जिस पर मैं चर्चा करूंगा वह सेट है ()। मैं पहले इस फ़ंक्शन के 'शैली' पैरामीटर का उपयोग कर रहा हूं। यह पैरामीटर मूल रूप से जलजनित विषयों से संबंधित है। वर्तमान में, उनमें से पांच उपलब्ध हैं जैसे कि डार्कग्रिड, टिक, व्हाइटग्रिड, व्हाइट और डार्क।

सफेद विषय का प्रदर्शन करने वाले निम्नलिखित उदाहरण पर विचार करें।

उदाहरण:

आयात सीबोनल के रूप में एसएनएस आयात matplotlib.pyplot plt sns.set (शैली = 'सफ़ेद', color_codes = True) a = sns.load_dataset ('टिप्स') sns.boxplot (x = 'day', y = 'total_bill') data = a)

OUTPUT:

उपरोक्त आउटपुट में, आप देख सकते हैं कि थीम को सफेद में बदल दिया गया है। आप अन्य विषयों के साथ-साथ उनका उपयोग करके उन्हें आगे भी देख सकते हैं यदि आप पिछले आउटपुट में देखते हैं, तो ग्राफ़ के चारों ओर मौजूद कुल्हाड़ियाँ हैं। हालाँकि, यह भी despine () फ़ंक्शन का उपयोग करके अनुकूलन योग्य है। नीचे दिए गए उदाहरण को देखें।

उदाहरण:

आयात सीबोनल के रूप में एसएनएस आयात matplotlib.pyplot plt sns.set (शैली = 'सफ़ेद', color_codes = True) a = sns.load_dataset ('टिप्स') sns.boxplot (x = 'day', y = 'total_bill') data = a) sns.despine (ऑफसेट = 10, ट्रिम = ट्रू)

OUTPUT:



पिछले दो आउटपुट के बीच अंतर पर ध्यान दें। हालांकि, कई और विकल्प हैं जो आप अपने लिए तलाश सकते हैं।

पायथन सीबोर्न कलर-पैलेट्स:

रंग मूल रूप से वह विशेषता है जो किसी अन्य विशेषता से परे मानव आंखों के पास जाती है। सीबोर्न आपको विभिन्न कार्यों जैसे कि color_palette (), hls_palette (), husl_palette (), आदि का उपयोग करके रंगों के साथ खेलने की अनुमति देता है। वर्तमान में Seaborn के भीतर मौजूद रंगों पर एक नज़र डालें।

उदाहरण:

एनपी आयात सीपो के रूप में सुन्न आयात के रूप में एसएनएस आयात matplotlib.pyplot plt sns.set () presentcolors = sns.color_palette () sns.palplot (presentcolors) के रूप में

OUTPUT:

उपरोक्त छवि उन रंगों को दिखाती है जो समुद्र में मौजूद हैं। मैंने इसे पालपोट () फ़ंक्शन का उपयोग करके किया है। गहरी विविधताओं के लिए, आप hls_palette (), husl_palette (), आदि का उपयोग कर सकते हैं।

यह हमें पायथन सीबोर्न ट्यूटोरियल के अंत में लाता है। मुझे उम्मीद है कि आप सब कुछ स्पष्ट रूप से समझ गए होंगे। सुनिश्चित करें कि आप जितना संभव हो उतना अभ्यास करें

क्या आप हमसे कोई प्रश्न पूछना चाहते हैं? कृपया इस 'पायथन सीबोर्न ट्यूटोरियल' ब्लॉग के टिप्पणी अनुभाग में इसका उल्लेख करें और हम आपको जल्द से जल्द वापस मिलेंगे।

अपने विभिन्न अनुप्रयोगों के साथ अजगर पर गहराई से ज्ञान प्राप्त करने के लिए, आप लाइव के लिए नामांकन कर सकते हैं 24/7 समर्थन और आजीवन पहुंच के साथ।