मशीन लर्निंग निस्संदेह युग की सबसे अधिक मांग वाली तकनीक है! अगर आप मशीन लर्निंग से शुरुआत कर रहे हैं, तो यह महत्वपूर्ण है कि आप मशीन लर्निंग के लिए आवश्यक शर्तें जानें। यह ब्लॉग आपको उन विभिन्न अवधारणाओं को समझने में मदद करेगा, जिन्हें आपको मशीन लर्निंग के साथ शुरू करने से पहले जानना होगा।
आर्टिफिशियल इंटेलिजेंस और मशीन लर्निंग का गहराई से ज्ञान प्राप्त करने के लिए, आप लाइव के लिए नामांकन कर सकते हैं 24/7 समर्थन और आजीवन पहुंच के साथ Edureka द्वारा।
यहाँ विषयों की एक सूची है इस ब्लॉग में शामिल हैं:
मशीन लर्निंग के लिए आवश्यक शर्तें
के साथ आरंभ करने के लिएमशीन लर्निंग आपको निम्नलिखित अवधारणाओं से परिचित होना चाहिए:
सांख्यिकी
सांख्यिकी में ऐसे उपकरण होते हैं जिनका उपयोग डेटा से कुछ परिणाम प्राप्त करने के लिए किया जा सकता है। वर्णनात्मक आँकड़े हैं जो कुछ महत्वपूर्ण जानकारी में कच्चे डेटा को बदलने के लिए उपयोग किया जाता है। इसके अलावा, पूर्ण डेटासेट का उपयोग करने के बजाय डेटा के नमूने से महत्वपूर्ण जानकारी प्राप्त करने के लिए हीन सांख्यिकी का उपयोग किया जा सकता है।
इस बारे में और जानने के लिए सांख्यिकी आप निम्नलिखित ब्लॉगों के माध्यम से जा सकते हैं:
लीनियर अलजेब्रा
रैखिक बीजगणित सौदोंवैक्टर, मैट्रिस और रैखिक परिवर्तनों के साथ। यह मशीन लर्निंग में बहुत महत्वपूर्ण है क्योंकि इसका उपयोग डेटासेट पर ऑपरेशंस को बदलने और करने के लिए किया जा सकता है।
पथरी
कलन गणित में एक महत्वपूर्ण क्षेत्र है और यह कई मशीन लर्निंग एल्गोरिदम में एक अभिन्न भूमिका निभाता है। कई विशेषताओं वाले डेटा सेट हैंमशीन लर्निंग मॉडल बनाने के लिए उपयोग किया जाता है क्योंकि कई मल्टीवेरिबल कैलकुलस हैं जो मशीन लर्निंग मॉडल बनाने में महत्वपूर्ण भूमिका निभाते हैं। एकीकरण और अंतर एक चाहिए।
संभावना
संभावना घटनाओं की संभावना का अनुमान लगाने में मदद करती है, यह स्थिति को फिर से होने या न होने का कारण बनने में हमारी मदद करती है। मशीन सीखने के लिए, संभावना एक है नींव।
प्रोबेबिलिटी के बारे में अधिक जानने के लिए, आप इसके माध्यम से जा सकते हैं ब्लॉग।
प्रोग्रामिंग भाषा
संपूर्ण मशीन लर्निंग प्रक्रिया को लागू करने के लिए आर और पायथन जैसी प्रोग्रामिंग भाषाओं को जानना आवश्यक है। पाइथन और आर दोनों इन-बिल्ट लाइब्रेरी प्रदान करते हैं जो मशीन लर्निंग एल्गोरिदम को लागू करना बहुत आसान बनाते हैं।
बुनियादी प्रोग्रामिंग ज्ञान होने के अलावा, यह भी महत्वपूर्ण है कि आप डेटा निकालना, प्रोसेस और विश्लेषण करना जानते हैं। यह मशीन लर्निंग के लिए सबसे महत्वपूर्ण कौशल में से एक है।
प्रोग्रामिंग के बारे में अधिक जानने के लिए मशीन लर्निंग के लिए भाषाएँ, आप निम्नलिखित ब्लॉगों के माध्यम से जा सकते हैं:
मशीन लर्निंग उपयोग मामला
मशीन लर्निंग एक एल्गोरिथ्म बनाने के बारे में है जो डेटा से सीख सकता है जैसे भविष्यवाणी करना कि चित्र में किस प्रकार की वस्तुएं हैं, या सिफारिश इंजन, कुछ बीमारी या स्पैम फ़िल्टरिंग को ठीक करने के लिए दवाओं का सबसे अच्छा संयोजन।
मशीन सीखना गणितीय पूर्वापेक्षाओं पर बनाया गया है और यदि आप जानते हैं कि मशीन सीखने में गणित का उपयोग क्यों किया जाता है तो यह मज़ेदार होगा। आपको उन फ़ंक्शन के पीछे के गणित को जानना होगा जो आप उपयोग कर रहे हैं और कौन सा मॉडल डेटा के लिए उपयुक्त है और क्यों।
तो चलो घर की कीमतों की भविष्यवाणी करने की एक दिलचस्प समस्या के साथ शुरू करते हैं, एक डाटासेट जिसमें विभिन्न विशेषताओं और कीमतों का इतिहास है, अब हम वर्ग फुट और कीमतों में रहने की जगह के क्षेत्र पर विचार करेंगे।
अब हमारे पास एक डेटा सेट है जिसमें नीचे दो कॉलम दिए गए हैं:
इन दो चर के बीच कुछ सहसंबंध होना चाहिए, यह पता लगाने के लिए कि हमें एक मॉडल बनाने की आवश्यकता होगी जो घरों की कीमत का अनुमान लगा सके, हम यह कैसे कर सकते हैं?
इस डेटा को ग्राफ़ करें और देखें कि यह कैसा दिखता है:
यहाँ X- अक्ष प्रति रहने की जगह की कीमत है और Y- अक्ष घर की कीमत है। यदि हम सभी डेटा पॉइंट्स को प्लॉट करते हैं तो हमें एक स्कैटर प्लॉट मिलेगा जिसे एक लाइन द्वारा दर्शाया जा सकता है जैसा कि ऊपर दिए गए चित्र में दिखाया गया है और यदि हम कुछ डेटा इनपुट करते हैं तो यह कुछ परिणाम की भविष्यवाणी करेगा। आदर्श रूप से, हमें एक पंक्ति ढूंढनी होगी जो अधिकतम डेटा बिंदुओं को काट देगी।
यहाँ हम एक लाइन बनाने की कोशिश कर रहे हैं, जिसे इस प्रकार कहा जाता है:
वाई = एमएक्स + सी
लक्ष्य (आश्रित चर) और भविष्य कहनेवाला चर (स्वतंत्र चर) के बीच रैखिक संबंध की भविष्यवाणी करने की इस पद्धति को रेखीय प्रतिगमन कहा जाता है। यह हमें दो चरों के बीच एक संबंध का अध्ययन और सारांश करने की अनुमति देता है।
- X = स्वतंत्र चर
- य = आश्रित चर
- c = y- इंटरसेप्ट
- m = रेखा का ढलान
यदि हम समीकरण पर विचार करते हैं तो हमारे पास X के लिए मान हैं जो एक स्वतंत्र चर है, इसलिए हम सभी को करना है कि वाई के मूल्य की भविष्यवाणी करने के लिए मी और सी के लिए मूल्यों की गणना करें।
तो हम इन चर को कैसे खोजते हैं?
इन चरों को खोजने के लिए, हम मानों का एक गुच्छा आज़मा सकते हैं और एक ऐसी रेखा का पता लगाने की कोशिश कर सकते हैं जो अधिकतम संख्या में डेटा बिंदुओं को काटती है। लेकिन, हम सबसे अच्छी लाइन कैसे पा सकते हैं?
तो सबसे अच्छा फिट लाइन खोजने के लिए, हम कम से कम चौकोर त्रुटि फ़ंक्शन का उपयोग कर सकते हैं जो कि y के वास्तविक मूल्य और अनुमानित मूल्य y` के बीच त्रुटि को ढूंढेगा।
निम्न समीकरण का उपयोग करते हुए सबसे कम-वर्ग त्रुटि फ़ंक्शन का प्रतिनिधित्व किया जा सकता है:
इस फ़ंक्शन का उपयोग करके हम डेटा बिंदु के वास्तविक मूल्य के साथ तुलना करके प्रत्येक अनुमानित डेटा बिंदु के लिए त्रुटि का पता लगा सकते हैं। फिर आप इन सभी त्रुटियों का सारांश लेते हैं और भविष्यवाणी में विचलन का पता लगाने के लिए उन्हें वर्ग करते हैं।
यदि हम अपने ग्राफ में तीसरे अक्ष को जोड़ते हैं जिसमें सभी संभावित त्रुटि मान होते हैं और इसे 3-आयामी स्थान में प्लॉट किया जाता है, तो यह इस तरह दिखेगा:
उपरोक्त छवि में, आदर्श मूल्य नीचे के काले भाग में होगा जो वास्तविक डेटा बिंदु के करीब कीमतों की भविष्यवाणी करेगा। अगला चरण मी और सी के लिए सर्वोत्तम संभव मानों को खोजना है। यह ढाल वंश नामक अनुकूलन तकनीक का उपयोग करके किया जा सकता है।
ग्रेडिएंट डीसेंट एक पुनरावृत्त विधि है, जहां हम अपने चरों के लिए कुछ मानों को निर्धारित करने के साथ शुरू करते हैं और वास्तविक मूल्य और अनुमानित मूल्य के बीच त्रुटि को कम करके उन्हें धीरे-धीरे सुधारते हैं।
अब अगर हमें लगता है कि व्यावहारिक रूप से अपार्टमेंट की कीमतें वास्तव में केवल प्रति वर्ग फीट की कीमत पर निर्भर नहीं करती हैं, तो कई कारक हैं जैसे कि बेडरूम, बाथरूम आदि की संख्या। यदि हम उन सुविधाओं पर भी विचार करते हैं, तो समीकरण कुछ दिखेगा। इस प्रकार सं
जावा उदाहरण कार्यक्रम में अशक्त सूचक अपवाद
Y = b0 + b1x1 + b2x2 + & hellip .. + bnxn + c
यह मल्टीलाइनर रिग्रेशन है जो लीनियर बीजगणित के अंतर्गत आता है, यहाँ हम mxn के मेट्रिसेस का उपयोग कर सकते हैं जहाँ m फीचर हैं और n डेटा पॉइंट हैं।
आइए एक और स्थिति पर विचार करें जहां हम घर की स्थिति का पता लगाने के लिए संभाव्यता का उपयोग कर सकते हैं ताकि यह अच्छी स्थिति या खराब स्थिति के आधार पर घर का वर्गीकरण कर सके। इसके लिए, हमें काम करने के लिए लॉजिस्टिक रिग्रेशन नामक एक तकनीक का उपयोग करना होगा जो कि सिग्मोइड फ़ंक्शन द्वारा प्रदर्शित होने वाली घटनाओं की संभावना पर काम करता है।
इस लेख में, हमने मशीन लर्निंग के पूर्वापेक्षाओं को कवर किया और उन्हें मशीन लर्निंग में कैसे लागू किया जाता है। तो मूल रूप से, इसमें सांख्यिकी, कैलकुलस, रैखिक बीजगणित और संभाव्यता सिद्धांत शामिल हैं। पथरी में अनुकूलन के लिए उपयोग की जाने वाली तकनीकें हैं, रैखिक बीजगणित में एल्गोरिदम होते हैं जो विशाल डेटा सेट पर काम कर सकते हैं, संभावना के साथ हम घटनाओं की संभावना का अनुमान लगा सकते हैं और आंकड़े हमें डेटा सेट के नमूने से उपयोगी अंतर्दृष्टि प्राप्त करने में मदद करते हैं।
अब जब आप मशीन लर्निंग के लिए आवश्यक शर्तें जानते हैं, तो मुझे यकीन है कि आप और जानने के लिए उत्सुक हैं। यहाँ कुछ ब्लॉग हैं जो आपको डेटा साइंस के साथ आरंभ करने में मदद करेंगे:
यदि आप आर्टिफिशियल इंटेलिजेंस और मशीन लर्निंग पर एक पूर्ण पाठ्यक्रम के लिए नामांकन करना चाहते हैं, तो एडुर्का ने विशेष रूप से क्यूरेट किया है जो आपको सुपरवाइज्ड लर्निंग, अनसुप्रवाइज्ड लर्निंग, और नेचुरल लैंग्वेज प्रोसेसिंग जैसी तकनीकों में पारंगत बना देगा। इसमें आर्टिफिशियल इंटेलिजेंस एंड मशीन लर्निंग में नवीनतम प्रगति और तकनीकी दृष्टिकोण पर प्रशिक्षण शामिल है जैसे डीप लर्निंग, ग्राफिकल मॉडल और सुदृढीकरण सीखना।