फजी के-मीन्स क्लाउटिंग इन महाउट



यह ब्लॉग Apache Mahout में Fuzzy K-Means क्लस्टरिंग का परिचय देता है।

फज़ी के-मीन्स बिल्कुल के-साधन के समान एल्गोरिथ्म है, जो एक लोकप्रिय सरल क्लस्टरिंग तकनीक है। केवल एक अंतर, केवल एक क्लस्टर के लिए एक बिंदु निर्दिष्ट करने के बजाय, इसमें दो या अधिक समूहों के बीच किसी प्रकार का फ़र्ज़ीपन या ओवरलैप हो सकता है। फ़ज़ी के-मीन्स का वर्णन करने वाले प्रमुख बिंदु निम्नलिखित हैं:





किसी सरणी में सबसे बड़ी संख्या ज्ञात करें
  • के-मीन्स के विपरीत, जो हार्ड क्लस्टर की तलाश करता है, जिसमें से प्रत्येक बिंदु एक क्लस्टर से संबंधित होता है, फजी के-मीन्स ओवरलैपिंग के लिए नरम क्लस्टर्स की तलाश करता है।
  • एक नरम क्लस्टर में एक बिंदु एक से अधिक क्लस्टर का हो सकता है जिसमें प्रत्येक बिंदु के प्रति एक निश्चित आत्मीयता हो।
  • आत्मीयता क्लस्टर सेंट्रोइड से उस बिंदु की दूरी के अनुपात में है।
  • K-Means के समान, Fuzzy K-Means उन वस्तुओं पर काम करता है जिनकी दूरी मापी गई है और उनमें प्रतिनिधित्व किया जा सकता है n- आयामी वेक्टर अंतरिक्ष।

फजी के-मीन्स मेप्रिड्यूस फ्लो

K-Means और Fuzzy K-Means के MapReduce प्रवाह के बीच बहुत अंतर नहीं है। महावत में दोनों का कार्यान्वयन समान है।

निम्नलिखित हैं आवश्यक पैरामीटर फज़ी के-मीन्स के कार्यान्वयन के लिए:



  • आपको इनपुट के लिए वेक्टर डेटा सेट की आवश्यकता है।
  • प्रारंभिक k समूहों को बीजित करने के लिए रैंडमसाइड जेनरेटर होना चाहिए।
  • दूरी की माप के लिए स्क्वेर्स यूक्लिडियनडिस्टेंस मेन्स की आवश्यकता होती है।
  • कंवर्जन थ्रेशोल्ड का एक बड़ा मूल्य, जैसे- 1.0 1.0, यदि दूरी माप के वर्ग मूल्य का उपयोग किया गया है
  • अधिकतम मानों के लिए एक मान डिफ़ॉल्ट मान -x 10 है।
  • सामान्य से अधिक गुणांक या फ़िज़नेस कारक, जिसका मान 1.0 से अधिक है

क्या आप हमसे कोई प्रश्न पूछना चाहते हैं? उन्हें टिप्पणी अनुभाग में उल्लेख करें और हम आपके पास वापस आ जाएंगे।

संबंधित पोस्ट

जावा में पूजो क्या है



Apache Mahout में सुपरवाइज्ड लर्निंग