स्पष्ट रूप से एक ऐसा क्षेत्र है जिसने पिछले कुछ वर्षों में पागल उन्नति देखी है। इस प्रवृत्ति और प्रगति ने उद्योग में नौकरी के बहुत सारे अवसर पैदा किए हैं। की जरूरत मशीन लर्निंग इंजीनियर्स मांग में उच्च है और यह वृद्धि उर्फ बिग डेटा की भारी मात्रा में प्रौद्योगिकी और उत्पादन विकसित करने के कारण है। इसलिए, इस लेख में, मैं सबसे अद्भुत मशीन लर्निंग प्रोजेक्ट्स के बारे में चर्चा करूंगा, जिन्हें निम्नलिखित क्रम में निश्चित रूप से जानना और काम करना चाहिए:
- मशीन लर्निंग क्या है?
- मशीन लर्निंग स्टेप्स
- मशीन लर्निंग के प्रकार
- उद्योग उपयोग-मामले
- 2019 के लिए ओपन सोर्स मशीन लर्निंग प्रोजेक्ट्स
मशीन लर्निंग क्या है?
मशीन लर्निंग एक अवधारणा है जो मशीन को उदाहरणों और अनुभव से सीखने की अनुमति देता है, और वह भी स्पष्ट रूप से प्रोग्राम किए बिना। इसलिए आपके द्वारा कोड लिखने के बजाय, आप क्या करते हैं, आप जेनेरिक एल्गोरिदम को डेटा खिलाते हैं, और एल्गोरिथ्म / मशीन दिए गए डेटा के आधार पर तर्क बनाता है।
मशीन लर्निंग स्टेप्स
कोई भी मशीन लर्निंग एल्गोरिथम एक सामान्य पैटर्न या चरणों का अनुसरण करता है।
डेटा एकत्रित करना: इस चरण में विभिन्न स्रोतों से सभी प्रासंगिक डेटा का संग्रह शामिल है
डेटा की तकलीफ़: यह 'रॉ डेटा' को एक प्रारूप में साफ करने और परिवर्तित करने की प्रक्रिया है जो सुविधाजनक खपत की अनुमति देता है
डेटा का विश्लेषण: मॉडल तैयार करने के लिए आवश्यक डेटा को चुनने और फ़िल्टर करने के लिए डेटा का विश्लेषण किया जाता है
ट्रेन एल्गोरिथ्म: एल्गोरिदम को प्रशिक्षण डेटासेट पर प्रशिक्षित किया जाता है, जिसके माध्यम से एल्गोरिथ्म पैटर्न और उन नियमों को समझता है जो डेटा को नियंत्रित करते हैं
टेस्ट मॉडल: परीक्षण डेटासेट हमारे मॉडल की सटीकता निर्धारित करता है।
परिनियोजन: यदि मॉडल की गति और सटीकता स्वीकार्य है, तो उस मॉडल को वास्तविक प्रणाली में तैनात किया जाना चाहिए। मॉडल को उसके प्रदर्शन के आधार पर तैनात किए जाने के बाद, मॉडल को अपडेट किया जाता है, तो मॉडल को अपडेट किया जाता है और उसमें सुधार किया जाता है।
मशीन लर्निंग के प्रकार
मशीन लर्निंग को तीन प्रकारों में उप-वर्गीकृत किया गया है:
पर्यवेक्षित अध्ययन: यह वह जगह है जहां आपके पास इनपुट चर (एक्स) और एक आउटपुट चर (वाई) है और आप इनपुट से आउटपुट तक मानचित्रण फ़ंक्शन को जानने के लिए एक एल्गोरिथ्म का उपयोग करते हैं।
अप्रशिक्षित शिक्षा: कभी-कभी दिए गए डेटा को अनस्ट्रक्चर्ड और अनलेबल किया जाता है। इसलिए उस डेटा को विभिन्न श्रेणियों में वर्गीकृत करना मुश्किल हो जाता है। अनसुनी शिक्षा इस समस्या को हल करने में मदद करती है। यह सीखने का उपयोग कक्षाओं में इनपुट डेटा को उनके सांख्यिकीय गुणों के आधार पर क्लस्टर करने के लिए किया जाता है।
सुदृढीकरण सीखना: यह किसी विशेष स्थिति में इनाम को अधिकतम करने के लिए उचित कार्रवाई करने के बारे में है।
जब सुदृढीकरण सीखने की बात आती है, तो अपेक्षित उत्पादन नहीं होता है। सुदृढीकरण एजेंट यह तय करता है कि किसी दिए गए कार्य को करने के लिए क्या कार्रवाई की जाए। एक प्रशिक्षण डाटासेट के अभाव में, यह अपने अनुभव से सीखने के लिए बाध्य है।
अब, आइए कुछ वास्तविक जीवन मशीन लर्निंग प्रोजेक्ट्स पर एक नज़र डालें जो कंपनियों को लाभ उत्पन्न करने में मदद कर सकते हैं।
उद्योग उपयोग-मामले
1. गति का अध्ययन
डोमेन: आधा
फोकस: चयन प्रक्रिया का अनुकूलन करें
कैसे अजगर में एक वस्तु को इनिशियलाइज़ करना है
व्यवसाय चुनौती: मोशन स्टूडियो यूरोप का सबसे बड़ा रेडियो प्रोडक्शन हाउस है। एक बिलियन डॉलर से अधिक के राजस्व के साथ, कंपनी ने एक नया रियलिटी शो शुरू करने का फैसला किया है: आरजे स्टार। शो के प्रति प्रतिक्रिया अभूतपूर्व है और कंपनी वॉइस क्लिप से भर गई है। आपको एक एमएल विशेषज्ञ के रूप में आवाज को पुरुष / महिला के रूप में वर्गीकृत करना होगा ताकि निस्पंदन का पहला स्तर तेज हो।
महत्वपूर्ण मुद्दे: आवाज का नमूना लहजे में है।
व्यावसायिक लाभ: जबसे आरजे स्टार एक रियलिटी शो है, उम्मीदवारों का चयन करने का समय बहुत कम है। शो की पूरी सफलता और इसलिए मुनाफा त्वरित और सहज निष्पादन पर निर्भर करता है
आयात पंडों के रूप में पीडी आयात सुन्न के रूप में एनपी आयात matplotlib.pyplot के रूप में plt आयात समुद्र में sns% matplotlib इनलाइन आयात चेतावनियों चेतावनियों के रूप में।
# नहीं की जाँच करें। अभिलेखों का df.info () df.describe () df.isnull ()। sum ()
प्रिंट ('शेप ऑफ़ डेटा:', df.shape) प्रिंट ('लेबलों की कुल संख्या: {}'। स्वरूप (df.shape [0]) प्रिंट ('पुरुष की संख्या: {}') प्रारूप (df [) df.label == 'पुरुष']। आकार [0]) प्रिंट ('महिला की संख्या: {}') प्रारूप (df [df.label == 'महिला')। आकार [0])।
X = df.iloc [:,: -1] प्रिंट (df.shape) प्रिंट (X.shape)
sklearn.preprocessing import से लेबलईनकोडर y = df.iloc [:, - 1] लिंग_केनोडर = लेबलईनकोडर () y = लिंग_केनकोड.fit_transform (y) sklearn.preprocessing आयात StandardScaler scaler = StandardScaler () scal.fx.fit से scaler.transform (X) से sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = train_test_split (X, y, test_size = 0.3, random_state = 100), sklearn.svvvvsvsv.gov.in से आयात करें। , confusion_matrix svc_model = SVC () svc_model.fit (X_train, y_train) y_pred = svc_model.predict (X_test) प्रिंट ('एक्यूरेसी स्कोर:') प्रिंट (metrics.accuracy_score (y_est)।
प्रिंट (भ्रम_मेट्रिक्स (y_test, y_pred))
2. लिथोपियन
डोमेन: मोटर वाहन
फोकस: ड्राइवरों को प्रेरित करें
व्यवसाय चुनौती: Lithionpower इलेक्ट्रिक वाहन (ई-वाहन) बैटरी का सबसे बड़ा प्रदाता है। ड्राइवर बैटरी को आमतौर पर एक दिन के लिए किराए पर लेते हैं और फिर उसे कंपनी से चार्ज की गई बैटरी से बदल देते हैं। Lithionpower में ड्राइवर के ड्राइविंग इतिहास के आधार पर एक चर मूल्य निर्धारण मॉडल है। जैसे कि बैटरी का जीवन ओवरस्पीडिंग, प्रति दिन की दूरी पर चलने आदि जैसे कारकों पर निर्भर करता है। आपको एक एमएल विशेषज्ञ के रूप में एक क्लस्टर मॉडल बनाना होता है, जहां ड्राइविंग डेटा के आधार पर ड्राइवरों को एक साथ रखा जा सकता है।
महत्वपूर्ण मुद्दे: ड्राइवरों को क्लस्टर के आधार पर प्रोत्साहित किया जाएगा, इसलिए समूह बनाना सटीक होना चाहिए।
कारोबारी लाभ: मुनाफे में वृद्धि, 15-20% तक खराब इतिहास वाले ड्राइवरों से अधिक शुल्क लिया जाएगा।
आयात पंडों के रूप में पीडी आयात के रूप में खसखस के रूप में एनपी आयात matplotlib.pyplot के रूप में पीटी आयात समुद्र के रूप में एसपीएस snsset () # के लिए प्लॉट स्टाइलिंग% matplotlib इनलाइन आयात चेतावनियां चेतावनियों के लिए (। 'अनदेखी') plt.rcParams के रूप में आयात matplotlib.py। 'Fig.figsize'] = (12, 6) df = pd.read_csv ('driver-data.csv') df.head ()
df.info () df.describe ()
sklearn.cluster आयात से केमियंस #Taking 2 क्लस्टर किमी = = केमन्स (n_clusters = 2) df_analyze = df.drop ('id', धुरी = 1) kmeans.fit (d__analyze)
kmeans.cluster_centers_
प्रिंट (kmeans.labels_) प्रिंट (लेन (kmeans.labels_))
प्रिंट (प्रकार (kmeans.labels_)) अद्वितीय, मायने रखता है = np.unique (kmeans.labels_, return_counts = True) प्रिंट (तानाशाही (अद्वितीय, मायने रखता है))
df_analyze ['क्लस्टर'] = kmeans.labels_ sns.set_style ('whitegrid') sns.lmplot ('mean_dist_day', 'mean_over_speed_ncc', data = df_analyze, hue = 'क्लस्टर', पैलेट = 'coolwarm =') पहलू = 1, fit_reg = गलत)
# अब, आइए समूहों की जांच करें, जब n = 4 kmeans_4 = KMeans (n_clusters = 4) kmeans_4.fit (df.drop ('id', axis = 1)) kmeans_4.fit (df.drop ('id'), अक्ष = 1)) प्रिंट (kmeans_4.cluster_centers_) अनूठे, मायने रखता है = np.unique (kmeans_4.labels_, return_counts = True) kmeans_4.cluster_centers_ प्रिंट (तानाशाही (अनूठे, मायने रखता है)))
df_analyze ['क्लस्टर'] = kmeans_4.labels_ sns.set_style ('whitegrid') sns.lmplot ('mean_dist_day', 'mean_over_sp__perc', data = df_analyze, hue = 'क्लस्टर', palette = 'coolarmarm') पहलू = 1, fit_reg = गलत)
3. BluEx
डोमेन: प्रचालन तंत्र
फोकस: इष्टतम पथ
व्यवसाय चुनौती: BluEx भारत में एक प्रमुख लॉजिस्टिक कंपनी है। यह ग्राहकों को पैकेट के कुशल वितरण के लिए जाना जाता है। हालाँकि, BluEx को एक चुनौती का सामना करना पड़ रहा है जहाँ इसके वैन चालक डिलीवरी के लिए एक उप-अपनाने का रास्ता अपना रहे हैं। यह देरी और उच्च ईंधन लागत का कारण बन रहा है। आप एमएल विशेषज्ञ के रूप में सुदृढीकरण सीखने का उपयोग करके एक एमएल मॉडल बनाना है ताकि कार्यक्रम के माध्यम से कुशल मार्ग मिल सके।
महत्वपूर्ण मुद्दे: डेटा में बहुत सारे गुण हैं और वर्गीकरण मुश्किल हो सकता है।
कारोबारी लाभ: इष्टतम पथ लेकर ईंधन की लागत का 15% तक बचाया जा सकता है।
एनपी आयात पाइलैब के रूप में आयात एनपीटी आयात के रूप में पीटीटी आयात नेटवर्क एक्स के रूप में एनएक्स # अंकों के अंक_सूची = [(0,1), (1,5), (5,6), (5,4), (1,2), (2) , 3), (2,7)] लक्ष्य = 7 मानचित्रण = {0: 'प्रारंभ', 1: '1', 2: '2', 3: '3', 4: '4', 5: '5 ', 6:' 6 ', 7:' 7-डेस्टिनेशन '} G = nx.Graph () G.add_edges_from (points_list) pos = nx.spring_layout (जी, के = .5, केंद्र = points_list [2]) nx। .draw_networkx_nodes (G, pos, node_color = 'g') nx.draw_networkx_edges (G, pos, edge_color = 'b') nx.draw_networkx_labels (G, pos) plt.show ()
NO_OF_POINTS = 8 #Inititizing R Matrix R = np.matrix (np.ones (आकार = (NO_OF_POINTS, NO_OF_POINTS))) R * = -1 बिंदु से बिंदु_सूची में: प्रिंट (बिंदु) यदि बिंदु [1] == लक्ष्य: R [बिंदु] = १५० और: आर [बिंदु] = ० यदि बिंदु [०] == लक्ष्य: आर [बिंदु [:: - १]] = १५० और: # बिंदु का उल्टा आर [बिंदु [:: - १]] = 0
आर [लक्ष्य, लक्ष्य] = 150 आर
Q = np.matrix (np.zeros ([NO_OF_POINTS, NO_OF_POINTS])) # लर्निंग पैरामीटर गामा = 0.8 initial_state = 1 def available_actions (राज्य): current_state_row = R [स्थिति], av_act = np.where (current_state_row और ampamp & amp)। ) [1] वापसी av_act उपलब्ध_act = available_actions (initial_state) def नमूना_next_action (available_actions_range): next_action = int (np.random.choice (उपलब्ध_act, 1)) अगला next_action क्रिया = sample_next_act (उपलब्ध_act) डिफ अपडेट (current_state, एक्शन, एक्शन) को लौटाता है। : max_index = np.where (Q [क्रिया,] == np.max (Q [क्रिया,]))] [1] यदि max_index.shape [0] और ampampampgt 1: max_index - int (np.random.choice (max_index), size = 1)) और: max_index = int (max_index) max_value = Q [क्रिया, max_index] Q [current_state, action] = R [current_state, action] + गामा-मैक्सिमल प्रिंट ('max_value', R [current_state, कार्रवाई] + गामा * max_value) यदि (np.max (Q) और ampampampgt 0): रिटर्न (np.sum (Q / np.max (Q) * 100)) और: रिटर्न (0) अपडेट (प्रारंभिक_स्टेट, एक्शन, गामा)
स्कोर = [] मैं रेंज में (700) के लिए: current_state = np.random.randint (0, int (Q.shape [0])) उपलब्ध_act = available_actions (current_state) एक्शन = नमूना-next_action (उपलब्ध_act) स्कोर = अपडेट (current_state,) कार्रवाई, गामा) स्कोर.एपेंड (स्कोर) प्रिंट ('स्कोर:', स्ट्रैट (स्कोर)) प्रिंट ('प्रशिक्षित क्यू मैट्रिक्स:') प्रिंट (क्यू / np.max (क्यू) * 100) # परीक्षण current_state = 0 चरण = [current_state] जबकि current_state! = 7: next_step_index = np.where (Q [current_state,] == np.max (Q [current_state,]))] [1] यदि next_step_index.shape [0] & ampampampgt 1: next_step_index (np.random.choice (next_step_index, size = 1)) बाकी: next_step_index = int (next_step_index) steps.append (next_step_index) current_state = next_step_index
प्रिंट ('सबसे कुशल पथ:') प्रिंट (चरण) plt.plot (स्कोर) plt.show ()
ओपन सोर्स मशीन लर्निंग प्रोजेक्ट्स 2019 में
पता लगाने वाला : डिटेक्ट्रॉन फेसबुक एआई रिसर्च की सॉफ्टवेयर प्रणाली है जो अत्याधुनिक ऑब्जेक्ट डिटेक्शन एल्गोरिदम को लागू करती है। यह पायथन में लिखा गया है और Caffe2 गहन शिक्षण ढांचे द्वारा संचालित है।
Detectron का लक्ष्य ऑब्जेक्ट डिटेक्शन रिसर्च के लिए एक उच्च-गुणवत्ता, उच्च-प्रदर्शन कोडबेस प्रदान करना है। यह उपन्यास अनुसंधान के तेजी से कार्यान्वयन और मूल्यांकन का समर्थन करने के लिए लचीला होने के लिए डिज़ाइन किया गया है। इसमें 50 से अधिक पूर्व प्रशिक्षित मॉडल शामिल हैं।
सघनता : घने मानव मुद्रा अनुमान का उद्देश्य मानव शरीर के 3 जी सतह पर RGB छवि के सभी मानव पिक्सेल की मैपिंग करना है। DensePose-RCNN को डिटेक्ट्रॉन फ्रेमवर्क में लागू किया गया है।
TensorFlow.js : यह एमएल मॉडल विकसित करने और ब्राउज़र में तैनाती और प्रशिक्षण के लिए एक पुस्तकालय है। यह इस साल की शुरुआत में रिलीज़ होने के बाद से बहुत लोकप्रिय रिलीज़ बन गया है और इसके लचीलेपन के साथ विस्मित करना जारी है। इसके साथ ही आप कर सकते हैं
- ब्राउज़र में ML विकसित करें: निम्न-स्तरीय जावास्क्रिप्ट रैखिक बीजगणित पुस्तकालय या उच्च-स्तरीय परतों एपीआई का उपयोग करके मॉडल को खरोंच से बनाने के लिए लचीले और सहज ज्ञान युक्त एपीआई का उपयोग करें।
- मौजूदा मॉडल चलाएं : TensorFlow.js मॉडल कन्वर्टर्स का उपयोग ब्राउज़र में पहले से चल रहे TensorFlow मॉडल को चलाने के लिए करें।
- मौजूदा मॉडल को पुनःप्राप्त करें: ब्राउज़र, या अन्य क्लाइंट-साइड डेटा से जुड़े सेंसर डेटा का उपयोग करके पहले से मौजूद एमएल मॉडल को फिर से लिखें।
तरंग: मशीन लर्निंग भी ऑडियो प्रोसेसिंग में प्रमुख प्रगति कर रहा है और यह केवल संगीत या वर्गीकरण उत्पन्न नहीं कर रहा है। WaveGlow NVIDIA द्वारा भाषण संश्लेषण के लिए एक प्रवाह-आधारित जनरेटिव नेटवर्क है। शोधकर्ताओं ने उन चरणों को भी सूचीबद्ध किया है जिनका आप अनुसरण कर सकते हैं यदि आप अपने स्वयं के मॉडल को खरोंच से प्रशिक्षित करना चाहते हैं।
कैसे जावा में stringbuffer का उपयोग करने के लिए
छवि आउटपेंटिंग : कल्पना कीजिए कि आपके पास एक दृश्य की आधी छवि है और आप पूर्ण दृश्यों को चाहते थे, अच्छी तरह से कि क्या छवि आउटपैनिंग आपके लिए कर सकती है। यह परियोजना स्टैनफोर्ड के इमेज आउटपैनिंग पेपर का एक केरस कार्यान्वयन है। मॉडल के साथ प्रशिक्षित किया गया था 3500 है अप करने के लिए बहस के साथ समुद्र तट डेटा बिखरे हुए 10,500 है के लिए चित्र 25 युग ।
यह एक अद्भुत पेपर है जिसमें स्टेप बाई स्टेप विवरण दिया गया है। सभी मशीन लर्निंग उत्साही के लिए एक उदाहरण का प्रयास करना चाहिए। व्यक्तिगत रूप से, यह मेरा पसंदीदा मशीन लर्निंग प्रोजेक्ट है।
दीप चित्रकाराय नमः : खैर, छवियों के बारे में बात करते हुए, यह एक उत्कृष्ट कृति है। यह एल्गोरिथ्म क्या करता है, एक छवि को इनपुट के रूप में लेता है और फिर यदि आप एक बाहरी तत्व को छवि में जोड़ते हैं, तो यह उस तत्व को परिवेश में मिश्रित करता है जैसे कि वह इसका एक हिस्सा है।
क्या आप मुझे अंतर बता सकते हैं? कोई अधिकार नहीं? खैर, यह हमें दिखाता है कि मशीन लर्निंग के मामले में हम कितने आगे आ गए हैं।
गहरी: अब, यहां छवियों पर एक करीबी नज़र डालें, आप एक छड़ी आंकड़ा स्पिन-किक, बैकफ्लिप, और कार्टव्हील करते हुए देखते हैं। कि मेरा दोस्त कार्रवाई में सीखने को सुदृढ़ कर रहा है। डीपमिमिक एक उदाहरण-निर्देशित डीप रिनफोर्समेंट लर्निंग ऑफ़ फिज़िक्स-आधारित चरित्र कौशल है।
मजेंटा : मजेंटा एक शोध परियोजना है जो कला और संगीत बनाने की प्रक्रिया में मशीन सीखने की भूमिका की खोज करती है। मुख्य रूप से इसमें गीत, चित्र, चित्र और अन्य सामग्री तैयार करने के लिए नए गहरे शिक्षण और सुदृढीकरण सीखने के एल्गोरिदम का विकास करना शामिल है।
यह स्मार्ट टूल और इंटरफेस बनाने में भी एक अन्वेषण है जो कलाकारों और संगीतकारों को आगे बढ़ने की अनुमति देता है ( जगह नहीं! ) इन मॉडलों का उपयोग करते हुए उनकी प्रक्रिया। अपने पंख फैलाएं, इंस्टाग्राम या साउंडक्लाउड के लिए अपनी अनूठी सामग्री बनाएं और एक प्रभावशाली व्यक्ति बनें।
तो दोस्तों, इसके साथ हम इस अद्भुत मशीन लर्निंग प्रोजेक्ट्स लेख के अंत में आते हैं। इन उदाहरणों को आज़माएं और हमें नीचे टिप्पणी अनुभाग में बताएं। मुझे आशा है कि आपको उद्योग में मशीन लर्निंग के व्यावहारिक कार्यान्वयन का पता चल जाएगा। एडुर्का की आपको सुपरवाइज्ड लर्निंग, अनसुप्रवाइज्ड लर्निंग और नेचुरल लैंग्वेज प्रोसेसिंग जैसी तकनीकों में पारंगत बनाता है। इसमें आर्टिफिशियल इंटेलिजेंस एंड मशीन लर्निंग में नवीनतम प्रगति और तकनीकी दृष्टिकोण पर प्रशिक्षण शामिल है जैसे डीप लर्निंग, ग्राफिकल मॉडल और सुदृढीकरण सीखना