डेटा खनन और ओएलएपी के बीच का अंतर

Anonim

डेटा खनन बनाम ओलाप

दोनों डेटा खनन और ओएलएपी दोनों सामान्य व्यापार खुफिया (बीआई) प्रौद्योगिकियों व्यवसायिक सूचना व्यावसायिक डेटा से उपयोगी जानकारी को पहचानने और निकालने के लिए कंप्यूटर आधारित तरीकों का संदर्भ देती है। डेटा खनन कंप्यूटर विज्ञान का क्षेत्र है, जो डेटा के बड़े सेटों से दिलचस्प पैटर्न निकालने का काम करता है। यह कृत्रिम बुद्धि, सांख्यिकी और डेटाबेस प्रबंधन से कई तरीकों को जोड़ती है। ओएलएपी (ऑनलाइन विश्लेषणात्मक प्रसंस्करण) नाम के रूप में सुझाव देते हैं कि बहु-आयामी डेटाबेस को क्वेरी करने के तरीकों का एक संकलन है।

डेटा खनन को डेटा में ज्ञान डिस्कवरी (केडीडी) के रूप में भी जाना जाता है। जैसा कि ऊपर बताया गया है, यह कंप्यूटर विज्ञान का एक क्षेत्र है, जो कच्चे आंकड़ों से पहले अज्ञात और दिलचस्प जानकारी निकालने का काम करता है। डेटा के घातीय वृद्धि के कारण, विशेष रूप से व्यापार जैसे क्षेत्रों में, डेटा खनन व्यवसाय खुफिया में डेटा के इस बड़े धन को परिवर्तित करने के लिए बहुत महत्वपूर्ण उपकरण बन गया है, क्योंकि पिछले कुछ दशकों में मैनुअल निष्कर्षण पैटर्न उतना ही असंभव हो गया है। उदाहरण के लिए, यह वर्तमान में सोशल नेटवर्क विश्लेषण, धोखाधड़ी का पता लगाने और विपणन जैसे विभिन्न अनुप्रयोगों के लिए उपयोग किया जाता है। डेटा खनन आमतौर पर निम्नलिखित चार कार्यों से संबंधित होता है: क्लस्टरिंग, वर्गीकरण, प्रतिगमन, और एसोसिएशन। क्लस्टरिंग अनस्ट्रक्टेड डेटा से समान समूहों की पहचान कर रहा है। वर्गीकरण सीखने के नियम हैं जिन्हें नए डेटा पर लागू किया जा सकता है और इसमें निम्न चरणों में शामिल होगा: डेटा का प्रीप्रोसिंग, मॉडलिंग डिजाइनिंग, सीखने / सुविधा चयन और मूल्यांकन / मान्यता। प्रतिगमन मॉडल डेटा के लिए न्यूनतम त्रुटि वाले कार्यों को ढूंढ रहा है और एसोसिएशन चर के बीच रिश्तों की तलाश कर रहा है। डेटा खनन आमतौर पर उन सवालों के जवाब देने के लिए किया जाता है जैसे वाल-मार्ट में अगले साल उच्च लाभ प्राप्त करने के लिए मुख्य उत्पाद क्या हैं।

-2 ->

ओएलएपी सिस्टम की एक श्रेणी है, जो बहु-आयामी क्वेरी के उत्तर प्रदान करती है। आम तौर पर ओएलएपी का प्रयोग विपणन, बजट, पूर्वानुमान और इसी तरह के अनुप्रयोगों के लिए किया जाता है। यह कहने के बिना जाता है कि ओएलएपी के लिए उपयोग किए जाने वाले डेटाबेस जटिल और तदर्थ प्रश्नों के लिए कॉन्फ़िगर किए जाते हैं जो कि मन में त्वरित प्रदर्शन के साथ होता है। आमतौर पर एक मैट्रिक्स को ओएलएपी के आउटपुट को प्रदर्शित करने के लिए उपयोग किया जाता है। पंक्तियों और स्तंभ क्वेरी के आयाम के आधार पर बनते हैं। सारांश प्राप्त करने के लिए वे कई तालिकाओं पर अक्सर एकत्रीकरण के तरीकों का उपयोग करते हैं। उदाहरण के लिए, पिछले साल की तुलना में इस वर्ष की बिक्री के बारे में वाल-मार्ट में पता लगाया जा सकता है? अगली तिमाही में बिक्री पर पूर्वानुमान क्या है? प्रतिशत परिवर्तन को देखते हुए प्रवृत्ति के बारे में क्या कहा जा सकता है?

-3 ->

हालांकि यह स्पष्ट है कि डेटा खनन और ओएलएपी समान हैं क्योंकि वे डेटा पर काम करने के लिए बुद्धि प्राप्त करते हैं, मुख्य अंतर यह है कि वे डेटा पर कैसे काम करते हैं।ओएलएपी उपकरण बहुआयामी डेटा विश्लेषण प्रदान करते हैं और वे डेटा के सारांश प्रदान करते हैं लेकिन इसके विपरीत, डेटा खनन डेटा के सेट में अनुपात, पैटर्न और प्रभावों पर केंद्रित है। यह एग्रीगेशन के साथ एक ओएलएपी सौदा है, जो डेटा के संचालन को "अतिरिक्त" के माध्यम से उगल देता है, लेकिन डेटा खनन "विभाजन" से मेल खाती है। अन्य उल्लेखनीय अंतर यह है कि डेटा खनन उपकरण मॉडल डेटा और वापसी कार्रवाई करने योग्य नियमों के दौरान, ओअलएप वास्तविक समय में व्यापार आयाम के साथ तुलना और इसके विपरीत तकनीकों का संचालन करेगा।