2019 में प्रयास करने के लिए नवीनतम मशीन लर्निंग प्रोजेक्ट



यह लेख आपको उद्योग में मशीन लर्निंग प्रोजेक्ट्स और इस क्षेत्र में की गई सफलताओं का व्यापक ज्ञान प्रदान करेगा।

स्पष्ट रूप से एक ऐसा क्षेत्र है जिसने पिछले कुछ वर्षों में पागल उन्नति देखी है। इस प्रवृत्ति और प्रगति ने उद्योग में नौकरी के बहुत सारे अवसर पैदा किए हैं। की जरूरत मशीन लर्निंग इंजीनियर्स मांग में उच्च है और यह वृद्धि उर्फ ​​बिग डेटा की भारी मात्रा में प्रौद्योगिकी और उत्पादन विकसित करने के कारण है। इसलिए, इस लेख में, मैं सबसे अद्भुत मशीन लर्निंग प्रोजेक्ट्स के बारे में चर्चा करूंगा, जिन्हें निम्नलिखित क्रम में निश्चित रूप से जानना और काम करना चाहिए:

मशीन लर्निंग क्या है?

मशीन लर्निंग एक अवधारणा है जो मशीन को उदाहरणों और अनुभव से सीखने की अनुमति देता है, और वह भी स्पष्ट रूप से प्रोग्राम किए बिना। इसलिए आपके द्वारा कोड लिखने के बजाय, आप क्या करते हैं, आप जेनेरिक एल्गोरिदम को डेटा खिलाते हैं, और एल्गोरिथ्म / मशीन दिए गए डेटा के आधार पर तर्क बनाता है।





जो एक ML Engineer है

मशीन लर्निंग स्टेप्स

कोई भी मशीन लर्निंग एल्गोरिथम एक सामान्य पैटर्न या चरणों का अनुसरण करता है।



डेटा एकत्रित करना: इस चरण में विभिन्न स्रोतों से सभी प्रासंगिक डेटा का संग्रह शामिल है

डेटा की तकलीफ़: यह 'रॉ डेटा' को एक प्रारूप में साफ करने और परिवर्तित करने की प्रक्रिया है जो सुविधाजनक खपत की अनुमति देता है

डेटा का विश्लेषण: मॉडल तैयार करने के लिए आवश्यक डेटा को चुनने और फ़िल्टर करने के लिए डेटा का विश्लेषण किया जाता है



ट्रेन एल्गोरिथ्म: एल्गोरिदम को प्रशिक्षण डेटासेट पर प्रशिक्षित किया जाता है, जिसके माध्यम से एल्गोरिथ्म पैटर्न और उन नियमों को समझता है जो डेटा को नियंत्रित करते हैं

टेस्ट मॉडल: परीक्षण डेटासेट हमारे मॉडल की सटीकता निर्धारित करता है।

परिनियोजन: यदि मॉडल की गति और सटीकता स्वीकार्य है, तो उस मॉडल को वास्तविक प्रणाली में तैनात किया जाना चाहिए। मॉडल को उसके प्रदर्शन के आधार पर तैनात किए जाने के बाद, मॉडल को अपडेट किया जाता है, तो मॉडल को अपडेट किया जाता है और उसमें सुधार किया जाता है।

मशीन लर्निंग के प्रकार

मशीन लर्निंग को तीन प्रकारों में उप-वर्गीकृत किया गया है:

पर्यवेक्षित अध्ययन: यह वह जगह है जहां आपके पास इनपुट चर (एक्स) और एक आउटपुट चर (वाई) है और आप इनपुट से आउटपुट तक मानचित्रण फ़ंक्शन को जानने के लिए एक एल्गोरिथ्म का उपयोग करते हैं।

अप्रशिक्षित शिक्षा: कभी-कभी दिए गए डेटा को अनस्ट्रक्चर्ड और अनलेबल किया जाता है। इसलिए उस डेटा को विभिन्न श्रेणियों में वर्गीकृत करना मुश्किल हो जाता है। अनसुनी शिक्षा इस समस्या को हल करने में मदद करती है। यह सीखने का उपयोग कक्षाओं में इनपुट डेटा को उनके सांख्यिकीय गुणों के आधार पर क्लस्टर करने के लिए किया जाता है।

सुदृढीकरण सीखना: यह किसी विशेष स्थिति में इनाम को अधिकतम करने के लिए उचित कार्रवाई करने के बारे में है।
जब सुदृढीकरण सीखने की बात आती है, तो अपेक्षित उत्पादन नहीं होता है। सुदृढीकरण एजेंट यह तय करता है कि किसी दिए गए कार्य को करने के लिए क्या कार्रवाई की जाए। एक प्रशिक्षण डाटासेट के अभाव में, यह अपने अनुभव से सीखने के लिए बाध्य है।

अब, आइए कुछ वास्तविक जीवन मशीन लर्निंग प्रोजेक्ट्स पर एक नज़र डालें जो कंपनियों को लाभ उत्पन्न करने में मदद कर सकते हैं।

उद्योग उपयोग-मामले

1. गति का अध्ययन

डोमेन: आधा

फोकस: चयन प्रक्रिया का अनुकूलन करें

कैसे अजगर में एक वस्तु को इनिशियलाइज़ करना है

व्यवसाय चुनौती: मोशन स्टूडियो यूरोप का सबसे बड़ा रेडियो प्रोडक्शन हाउस है। एक बिलियन डॉलर से अधिक के राजस्व के साथ, कंपनी ने एक नया रियलिटी शो शुरू करने का फैसला किया है: आरजे स्टार। शो के प्रति प्रतिक्रिया अभूतपूर्व है और कंपनी वॉइस क्लिप से भर गई है। आपको एक एमएल विशेषज्ञ के रूप में आवाज को पुरुष / महिला के रूप में वर्गीकृत करना होगा ताकि निस्पंदन का पहला स्तर तेज हो।

महत्वपूर्ण मुद्दे: आवाज का नमूना लहजे में है।

व्यावसायिक लाभ: जबसे आरजे स्टार एक रियलिटी शो है, उम्मीदवारों का चयन करने का समय बहुत कम है। शो की पूरी सफलता और इसलिए मुनाफा त्वरित और सहज निष्पादन पर निर्भर करता है

आयात पंडों के रूप में पीडी आयात सुन्न के रूप में एनपी आयात matplotlib.pyplot के रूप में plt आयात समुद्र में sns% matplotlib इनलाइन आयात चेतावनियों चेतावनियों के रूप में।

# नहीं की जाँच करें। अभिलेखों का df.info () df.describe () df.isnull ()। sum ()

प्रिंट ('शेप ऑफ़ डेटा:', df.shape) प्रिंट ('लेबलों की कुल संख्या: {}'। स्वरूप (df.shape [0]) प्रिंट ('पुरुष की संख्या: {}') प्रारूप (df [) df.label == 'पुरुष']। आकार [0]) प्रिंट ('महिला की संख्या: {}') प्रारूप (df [df.label == 'महिला')। आकार [0])।

X = df.iloc [:,: -1] प्रिंट (df.shape) प्रिंट (X.shape)

sklearn.preprocessing import से लेबलईनकोडर y = df.iloc [:, - 1] लिंग_केनोडर = लेबलईनकोडर () y = लिंग_केनकोड.fit_transform (y) sklearn.preprocessing आयात StandardScaler scaler = StandardScaler () scal.fx.fit से scaler.transform (X) से sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = train_test_split (X, y, test_size = 0.3, random_state = 100), sklearn.svvvvsvsv.gov.in से आयात करें। , confusion_matrix svc_model = SVC () svc_model.fit (X_train, y_train) y_pred = svc_model.predict (X_test) प्रिंट ('एक्यूरेसी स्कोर:') प्रिंट (metrics.accuracy_score (y_est)।

प्रिंट (भ्रम_मेट्रिक्स (y_test, y_pred))

2. लिथोपियन

डोमेन: मोटर वाहन

फोकस: ड्राइवरों को प्रेरित करें

व्यवसाय चुनौती: Lithionpower इलेक्ट्रिक वाहन (ई-वाहन) बैटरी का सबसे बड़ा प्रदाता है। ड्राइवर बैटरी को आमतौर पर एक दिन के लिए किराए पर लेते हैं और फिर उसे कंपनी से चार्ज की गई बैटरी से बदल देते हैं। Lithionpower में ड्राइवर के ड्राइविंग इतिहास के आधार पर एक चर मूल्य निर्धारण मॉडल है। जैसे कि बैटरी का जीवन ओवरस्पीडिंग, प्रति दिन की दूरी पर चलने आदि जैसे कारकों पर निर्भर करता है। आपको एक एमएल विशेषज्ञ के रूप में एक क्लस्टर मॉडल बनाना होता है, जहां ड्राइविंग डेटा के आधार पर ड्राइवरों को एक साथ रखा जा सकता है।

महत्वपूर्ण मुद्दे: ड्राइवरों को क्लस्टर के आधार पर प्रोत्साहित किया जाएगा, इसलिए समूह बनाना सटीक होना चाहिए।

कारोबारी लाभ: मुनाफे में वृद्धि, 15-20% तक खराब इतिहास वाले ड्राइवरों से अधिक शुल्क लिया जाएगा।

आयात पंडों के रूप में पीडी आयात के रूप में खसखस ​​के रूप में एनपी आयात matplotlib.pyplot के रूप में पीटी आयात समुद्र के रूप में एसपीएस snsset () # के लिए प्लॉट स्टाइलिंग% matplotlib इनलाइन आयात चेतावनियां चेतावनियों के लिए (। 'अनदेखी') plt.rcParams के रूप में आयात matplotlib.py। 'Fig.figsize'] = (12, 6) df = pd.read_csv ('driver-data.csv') df.head ()

df.info () df.describe ()

sklearn.cluster आयात से केमियंस #Taking 2 क्लस्टर किमी = = केमन्स (n_clusters = 2) df_analyze = df.drop ('id', धुरी = 1) kmeans.fit (d__analyze)

kmeans.cluster_centers_

प्रिंट (kmeans.labels_) प्रिंट (लेन (kmeans.labels_))

प्रिंट (प्रकार (kmeans.labels_)) अद्वितीय, मायने रखता है = np.unique (kmeans.labels_, return_counts = True) प्रिंट (तानाशाही (अद्वितीय, मायने रखता है))

df_analyze ['क्लस्टर'] = kmeans.labels_ sns.set_style ('whitegrid') sns.lmplot ('mean_dist_day', 'mean_over_speed_ncc', data = df_analyze, hue = 'क्लस्टर', पैलेट = 'coolwarm =') पहलू = 1, fit_reg = गलत)

# अब, आइए समूहों की जांच करें, जब n = 4 kmeans_4 = KMeans (n_clusters = 4) kmeans_4.fit (df.drop ('id', axis = 1)) kmeans_4.fit (df.drop ('id'), अक्ष = 1)) प्रिंट (kmeans_4.cluster_centers_) अनूठे, मायने रखता है = np.unique (kmeans_4.labels_, return_counts = True) kmeans_4.cluster_centers_ प्रिंट (तानाशाही (अनूठे, मायने रखता है)))

df_analyze ['क्लस्टर'] = kmeans_4.labels_ sns.set_style ('whitegrid') sns.lmplot ('mean_dist_day', 'mean_over_sp__perc', data = df_analyze, hue = 'क्लस्टर', palette = 'coolarmarm') पहलू = 1, fit_reg = गलत)

3. BluEx

डोमेन: प्रचालन तंत्र

फोकस: इष्टतम पथ

व्यवसाय चुनौती: BluEx भारत में एक प्रमुख लॉजिस्टिक कंपनी है। यह ग्राहकों को पैकेट के कुशल वितरण के लिए जाना जाता है। हालाँकि, BluEx को एक चुनौती का सामना करना पड़ रहा है जहाँ इसके वैन चालक डिलीवरी के लिए एक उप-अपनाने का रास्ता अपना रहे हैं। यह देरी और उच्च ईंधन लागत का कारण बन रहा है। आप एमएल विशेषज्ञ के रूप में सुदृढीकरण सीखने का उपयोग करके एक एमएल मॉडल बनाना है ताकि कार्यक्रम के माध्यम से कुशल मार्ग मिल सके।

महत्वपूर्ण मुद्दे: डेटा में बहुत सारे गुण हैं और वर्गीकरण मुश्किल हो सकता है।

कारोबारी लाभ: इष्टतम पथ लेकर ईंधन की लागत का 15% तक बचाया जा सकता है।

एनपी आयात पाइलैब के रूप में आयात एनपीटी आयात के रूप में पीटीटी आयात नेटवर्क एक्स के रूप में एनएक्स # अंकों के अंक_सूची = [(0,1), (1,5), (5,6), (5,4), (1,2), (2) , 3), (2,7)] लक्ष्य = 7 मानचित्रण = {0: 'प्रारंभ', 1: '1', 2: '2', 3: '3', 4: '4', 5: '5 ', 6:' 6 ', 7:' 7-डेस्टिनेशन '} G = nx.Graph () G.add_edges_from (points_list) pos = nx.spring_layout (जी, के = .5, केंद्र = points_list [2]) nx। .draw_networkx_nodes (G, pos, node_color = 'g') nx.draw_networkx_edges (G, pos, edge_color = 'b') nx.draw_networkx_labels (G, pos) plt.show ()

NO_OF_POINTS = 8 #Inititizing R Matrix R = np.matrix (np.ones (आकार = (NO_OF_POINTS, NO_OF_POINTS))) R * = -1 बिंदु से बिंदु_सूची में: प्रिंट (बिंदु) यदि बिंदु [1] == लक्ष्य: R [बिंदु] = १५० और: आर [बिंदु] = ० यदि बिंदु [०] == लक्ष्य: आर [बिंदु [:: - १]] = १५० और: # बिंदु का उल्टा आर [बिंदु [:: - १]] = 0

आर [लक्ष्य, लक्ष्य] = 150 आर

Q = np.matrix (np.zeros ([NO_OF_POINTS, NO_OF_POINTS])) # लर्निंग पैरामीटर गामा = 0.8 initial_state = 1 def available_actions (राज्य): current_state_row = R [स्थिति], av_act = np.where (current_state_row और ampamp & amp)। ) [1] वापसी av_act उपलब्ध_act = available_actions (initial_state) def नमूना_next_action (available_actions_range): next_action = int (np.random.choice (उपलब्ध_act, 1)) अगला next_action क्रिया = sample_next_act (उपलब्ध_act) डिफ अपडेट (current_state, एक्शन, एक्शन) को लौटाता है। : max_index = np.where (Q [क्रिया,] == np.max (Q [क्रिया,]))] [1] यदि max_index.shape [0] और ampampampgt 1: max_index - int (np.random.choice (max_index), size = 1)) और: max_index = int (max_index) max_value = Q [क्रिया, max_index] Q [current_state, action] = R [current_state, action] + गामा-मैक्सिमल प्रिंट ('max_value', R [current_state, कार्रवाई] + गामा * max_value) यदि (np.max (Q) और ampampampgt 0): रिटर्न (np.sum (Q / np.max (Q) * 100)) और: रिटर्न (0) अपडेट (प्रारंभिक_स्टेट, एक्शन, गामा)

स्कोर = [] मैं रेंज में (700) के लिए: current_state = np.random.randint (0, int (Q.shape [0])) उपलब्ध_act = available_actions (current_state) एक्शन = नमूना-next_action (उपलब्ध_act) स्कोर = अपडेट (current_state,) कार्रवाई, गामा) स्कोर.एपेंड (स्कोर) प्रिंट ('स्कोर:', स्ट्रैट (स्कोर)) प्रिंट ('प्रशिक्षित क्यू मैट्रिक्स:') प्रिंट (क्यू / np.max (क्यू) * 100) # परीक्षण current_state = 0 चरण = [current_state] जबकि current_state! = 7: next_step_index = np.where (Q [current_state,] == np.max (Q [current_state,]))] [1] यदि next_step_index.shape [0] & ampampampgt 1: next_step_index (np.random.choice (next_step_index, size = 1)) बाकी: next_step_index = int (next_step_index) steps.append (next_step_index) current_state = next_step_index

प्रिंट ('सबसे कुशल पथ:') प्रिंट (चरण) plt.plot (स्कोर) plt.show ()

ओपन सोर्स मशीन लर्निंग प्रोजेक्ट्स 2019 में

पता लगाने वाला : डिटेक्ट्रॉन फेसबुक एआई रिसर्च की सॉफ्टवेयर प्रणाली है जो अत्याधुनिक ऑब्जेक्ट डिटेक्शन एल्गोरिदम को लागू करती है। यह पायथन में लिखा गया है और Caffe2 गहन शिक्षण ढांचे द्वारा संचालित है।

Detectron का लक्ष्य ऑब्जेक्ट डिटेक्शन रिसर्च के लिए एक उच्च-गुणवत्ता, उच्च-प्रदर्शन कोडबेस प्रदान करना है। यह उपन्यास अनुसंधान के तेजी से कार्यान्वयन और मूल्यांकन का समर्थन करने के लिए लचीला होने के लिए डिज़ाइन किया गया है। इसमें 50 से अधिक पूर्व प्रशिक्षित मॉडल शामिल हैं।

सघनता : घने मानव मुद्रा अनुमान का उद्देश्य मानव शरीर के 3 जी सतह पर RGB छवि के सभी मानव पिक्सेल की मैपिंग करना है। DensePose-RCNN को डिटेक्ट्रॉन फ्रेमवर्क में लागू किया गया है।

TensorFlow.js : यह एमएल मॉडल विकसित करने और ब्राउज़र में तैनाती और प्रशिक्षण के लिए एक पुस्तकालय है। यह इस साल की शुरुआत में रिलीज़ होने के बाद से बहुत लोकप्रिय रिलीज़ बन गया है और इसके लचीलेपन के साथ विस्मित करना जारी है। इसके साथ ही आप कर सकते हैं

  • ब्राउज़र में ML विकसित करें: निम्न-स्तरीय जावास्क्रिप्ट रैखिक बीजगणित पुस्तकालय या उच्च-स्तरीय परतों एपीआई का उपयोग करके मॉडल को खरोंच से बनाने के लिए लचीले और सहज ज्ञान युक्त एपीआई का उपयोग करें।
  • मौजूदा मॉडल चलाएं : TensorFlow.js मॉडल कन्वर्टर्स का उपयोग ब्राउज़र में पहले से चल रहे TensorFlow मॉडल को चलाने के लिए करें।
  • मौजूदा मॉडल को पुनःप्राप्त करें: ब्राउज़र, या अन्य क्लाइंट-साइड डेटा से जुड़े सेंसर डेटा का उपयोग करके पहले से मौजूद एमएल मॉडल को फिर से लिखें।

तरंग: मशीन लर्निंग भी ऑडियो प्रोसेसिंग में प्रमुख प्रगति कर रहा है और यह केवल संगीत या वर्गीकरण उत्पन्न नहीं कर रहा है। WaveGlow NVIDIA द्वारा भाषण संश्लेषण के लिए एक प्रवाह-आधारित जनरेटिव नेटवर्क है। शोधकर्ताओं ने उन चरणों को भी सूचीबद्ध किया है जिनका आप अनुसरण कर सकते हैं यदि आप अपने स्वयं के मॉडल को खरोंच से प्रशिक्षित करना चाहते हैं।

कैसे जावा में stringbuffer का उपयोग करने के लिए

छवि आउटपेंटिंग : कल्पना कीजिए कि आपके पास एक दृश्य की आधी छवि है और आप पूर्ण दृश्यों को चाहते थे, अच्छी तरह से कि क्या छवि आउटपैनिंग आपके लिए कर सकती है। यह परियोजना स्टैनफोर्ड के इमेज आउटपैनिंग पेपर का एक केरस कार्यान्वयन है। मॉडल के साथ प्रशिक्षित किया गया था 3500 है अप करने के लिए बहस के साथ समुद्र तट डेटा बिखरे हुए 10,500 है के लिए चित्र 25 युग

यह एक अद्भुत पेपर है जिसमें स्टेप बाई स्टेप विवरण दिया गया है। सभी मशीन लर्निंग उत्साही के लिए एक उदाहरण का प्रयास करना चाहिए। व्यक्तिगत रूप से, यह मेरा पसंदीदा मशीन लर्निंग प्रोजेक्ट है।

दीप चित्रकाराय नमः : खैर, छवियों के बारे में बात करते हुए, यह एक उत्कृष्ट कृति है। यह एल्गोरिथ्म क्या करता है, एक छवि को इनपुट के रूप में लेता है और फिर यदि आप एक बाहरी तत्व को छवि में जोड़ते हैं, तो यह उस तत्व को परिवेश में मिश्रित करता है जैसे कि वह इसका एक हिस्सा है।

क्या आप मुझे अंतर बता सकते हैं? कोई अधिकार नहीं? खैर, यह हमें दिखाता है कि मशीन लर्निंग के मामले में हम कितने आगे आ गए हैं।

गहरी: अब, यहां छवियों पर एक करीबी नज़र डालें, आप एक छड़ी आंकड़ा स्पिन-किक, बैकफ्लिप, और कार्टव्हील करते हुए देखते हैं। कि मेरा दोस्त कार्रवाई में सीखने को सुदृढ़ कर रहा है। डीपमिमिक एक उदाहरण-निर्देशित डीप रिनफोर्समेंट लर्निंग ऑफ़ फिज़िक्स-आधारित चरित्र कौशल है।

मजेंटा : मजेंटा एक शोध परियोजना है जो कला और संगीत बनाने की प्रक्रिया में मशीन सीखने की भूमिका की खोज करती है। मुख्य रूप से इसमें गीत, चित्र, चित्र और अन्य सामग्री तैयार करने के लिए नए गहरे शिक्षण और सुदृढीकरण सीखने के एल्गोरिदम का विकास करना शामिल है।

यह स्मार्ट टूल और इंटरफेस बनाने में भी एक अन्वेषण है जो कलाकारों और संगीतकारों को आगे बढ़ने की अनुमति देता है ( जगह नहीं! ) इन मॉडलों का उपयोग करते हुए उनकी प्रक्रिया। अपने पंख फैलाएं, इंस्टाग्राम या साउंडक्लाउड के लिए अपनी अनूठी सामग्री बनाएं और एक प्रभावशाली व्यक्ति बनें।

तो दोस्तों, इसके साथ हम इस अद्भुत मशीन लर्निंग प्रोजेक्ट्स लेख के अंत में आते हैं। इन उदाहरणों को आज़माएं और हमें नीचे टिप्पणी अनुभाग में बताएं। मुझे आशा है कि आपको उद्योग में मशीन लर्निंग के व्यावहारिक कार्यान्वयन का पता चल जाएगा। एडुर्का की आपको सुपरवाइज्ड लर्निंग, अनसुप्रवाइज्ड लर्निंग और नेचुरल लैंग्वेज प्रोसेसिंग जैसी तकनीकों में पारंगत बनाता है। इसमें आर्टिफिशियल इंटेलिजेंस एंड मशीन लर्निंग में नवीनतम प्रगति और तकनीकी दृष्टिकोण पर प्रशिक्षण शामिल है जैसे डीप लर्निंग, ग्राफिकल मॉडल और सुदृढीकरण सीखना