केडीडी और डाटा खनन के बीच का अंतर

Anonim

केडीडी बनाम डेटा खनन

केडीडी (डाटाबेस में ज्ञान की खोज) निकालने में मदद करने के लिए उपकरण और सिद्धांत शामिल हैं, कंप्यूटर विज्ञान का एक क्षेत्र है, जो इसमें डिजीटल डेटा के बड़े संग्रह से उपयोगी और पहले अज्ञात जानकारी (यानी ज्ञान) निकालने में इंसानों की मदद करने के लिए उपकरण और सिद्धांत शामिल हैं केडीडी में कई कदम होते हैं, और डाटा खनन उनमें से एक है। डेटा खनन डेटा से पैटर्न निकालने के लिए एक विशिष्ट एल्गोरिथ्म का उपयोग होता है। इसके बावजूद, केडीडी और डाटा माइनिंग एक दूसरे के लिए प्रयोग किया जाता है।

केडीडी क्या है?

जैसा कि ऊपर उल्लेख किया गया है, केडीडी कंप्यूटर विज्ञान का एक क्षेत्र है, जो कच्चे आंकड़ों से पहले अज्ञात और रोचक जानकारी निकालने का काम करता है। केडीडी उचित तरीके या तकनीकों के विकास के माध्यम से डेटा की समझ बनाने की कोशिश करने की पूरी प्रक्रिया है। यह प्रक्रिया अन्य स्तरों में निम्न-स्तरीय डेटा के मैपिंग के साथ सौदा करती है, वे अधिक कॉम्पैक्ट, सार और उपयोगी होते हैं। यह छोटी रिपोर्ट बनाकर प्राप्त किया जाता है, डेटा बनाने और भविष्य कहने वाले मॉडल विकसित करने की प्रक्रिया को मॉडलिंग करता है जो भविष्य के मामलों की भविष्यवाणी कर सकता है। विशेष रूप से व्यवसाय जैसे क्षेत्रों में डेटा की घातीय वृद्धि के कारण, केडीडी बहुत ही महत्वपूर्ण प्रक्रिया बन गई है, जो डेटा के इस बड़े संपदा को व्यापारिक खुफिया में परिवर्तित करने के रूप में है, क्योंकि मैनुअल निष्कर्षण पिछले कुछ दशकों में असंभव हो गया है। उदाहरण के लिए, यह वर्तमान में सामाजिक नेटवर्क विश्लेषण, धोखाधड़ी का पता लगाने, विज्ञान, निवेश, विनिर्माण, दूरसंचार, डेटा सफाई, खेल, सूचना पुनर्प्राप्ति और बड़े पैमाने पर विपणन के लिए विभिन्न अनुप्रयोगों के लिए उपयोग किया जाता है। आम तौर पर केडीडी को ऐसे सवालों के जवाब देने के लिए प्रयोग किया जाता है जैसे वाल-मार्ट में अगले साल उच्च लाभ प्राप्त करने में मुख्य उत्पाद क्या हैं? । इस प्रक्रिया में कई कदम हैं। यह एप्लिकेशन डोमेन और लक्ष्य की समझ विकसित करने और एक लक्ष्य डेटासेट बनाने के साथ शुरू होता है। इसके बाद डेटा की सफाई, प्रीप्रोसेटिंग, कमी और प्रक्षेपण किया जाता है। अगला कदम पैटर्न की पहचान करने के लिए डेटा माइनिंग (समझाया गया है) का उपयोग कर रहा है। अंत में, खोज की गई जानकारी को दृश्यमान और / या व्याख्या करके समेकित किया जाता है।

डाटा माइनिंग क्या है?

जैसा ऊपर बताया गया है, डाटा माइनिंग समग्र केडीडी प्रक्रिया के भीतर ही एक कदम है। आवेदन के लक्ष्य के अनुसार परिभाषित दो प्रमुख डेटा खनन लक्ष्यों हैं, और वे अर्थात् सत्यापन या खोज हैं। सत्यापन डेटा के बारे में उपयोगकर्ता की अवधारणा को सत्यापित कर रहा है, जबकि खोज स्वचालित रूप से दिलचस्प पैटर्न ढूंढ रही है चार प्रमुख डेटा खनन कार्य हैं: क्लस्टरिंग, वर्गीकरण, प्रतिगमन, और संघ (सारांश)। क्लस्टरिंग अनस्ट्रक्टेड डेटा से समान समूहों की पहचान कर रहा है। वर्गीकरण नियम सीख रहा है जो नए डेटा पर लागू किया जा सकता है। प्रतिगमन मॉडल डेटा के लिए न्यूनतम त्रुटि वाले कार्यों को ढूंढ रहा हैऔर एसोसिएशन चर के बीच रिश्तों की तलाश कर रहा है। फिर, विशिष्ट डेटा खनन एल्गोरिथ्म का चयन होना चाहिए। लक्ष्य पर निर्भर करते हुए, रेखीय प्रतिगमन, उपन्यास प्रतिगमन, निर्णय के पेड़ और भोलेबाज़ जैसे विभिन्न एल्गोरिदम का चयन किया जा सकता है। फिर एक या अधिक अभ्यावेदनशील रूपों में रुचि के पैटर्न खोजे गए हैं। अंत में, मॉडल का मूल्यांकन या तो अनुमानित सटीकता या समझने के द्वारा किया जाता है।

केडीडी और डाटा खनन में क्या अंतर है?

हालांकि, दो शब्दों केडीडी और डाटा माइनिंग को भारी रूप से उपयोग किया जाता है, वे दो संबंधित अभी थोड़ा अलग अवधारणाओं का उल्लेख करते हैं। डेटा डायनेजिंग केडीडी प्रक्रिया के अंदर एक कदम है, जो डेटा में पैटर्न की पहचान करने के साथ सौदा है, केडीडी डेटा से ज्ञान निकालने की समग्र प्रक्रिया है। दूसरे शब्दों में, डाटा माइनिंग केवल केडीडी प्रक्रिया के समग्र लक्ष्य के आधार पर एक विशिष्ट एल्गोरिथ्म का ही आवेदन है।