डेटा खनन और डेटा भण्डारण के बीच का अंतर

Anonim

डेटा खनन बनाम डेटा वेयरहाउसिंग

डाटा माइनिंग और डाटा वेयरहाउस डेटा के विश्लेषण के लिए दोनों बहुत शक्तिशाली और लोकप्रिय तकनीक हैं। आंकड़ों की ओर झुका रहे उपयोगकर्ता डेटा माइनिंग का उपयोग करते हैं। डेटा में छिपे हुए पैटर्न के लिए वे सांख्यिकीय मॉडल का उपयोग करते हैं। डेटा खनिक विभिन्न डेटा तत्वों के बीच उपयोगी रिश्तों को खोजने में रुचि रखते हैं, जो व्यवसायों के लिए अंततः लाभदायक है। लेकिन दूसरी तरफ, डेटा विशेषज्ञ जो व्यापार के आयामों का विश्लेषण कर सकते हैं सीधे डेटा गोदामों का उपयोग करते हैं।

डेटा खनन को डेटा में ज्ञान डिस्कवरी (केडीडी) के रूप में भी जाना जाता है। जैसा कि ऊपर बताया गया है, यह कंप्यूटर विज्ञान का एक क्षेत्र है, जो कच्चे आंकड़ों से पहले अज्ञात और दिलचस्प जानकारी निकालने का काम करता है। डेटा के घातीय वृद्धि के कारण, विशेष रूप से व्यापार जैसे क्षेत्रों में, डेटा खनन व्यवसाय खुफिया में डेटा के इस बड़े धन को परिवर्तित करने के लिए बहुत महत्वपूर्ण उपकरण बन गया है, क्योंकि पिछले कुछ दशकों में मैनुअल निष्कर्षण पैटर्न उतना ही असंभव हो गया है। उदाहरण के लिए, यह वर्तमान में सोशल नेटवर्क विश्लेषण, धोखाधड़ी का पता लगाने और विपणन जैसे विभिन्न अनुप्रयोगों के लिए उपयोग किया जाता है। डेटा खनन आमतौर पर निम्नलिखित चार कार्यों से संबंधित होता है: क्लस्टरिंग, वर्गीकरण, प्रतिगमन, और एसोसिएशन। क्लस्टरिंग अनस्ट्रक्टेड डेटा से समान समूहों की पहचान कर रहा है। वर्गीकरण सीखने के नियम हैं जिन्हें नए डेटा पर लागू किया जा सकता है और इसमें विशेष रूप से निम्नलिखित कदम शामिल होंगे: डेटा का प्रीप्रोसिंग, मॉडलिंग डिजाइनिंग, सीखना / सुविधा चयन और मूल्यांकन / सत्यापन। प्रतिगमन मॉडल डेटा के लिए न्यूनतम त्रुटि वाले कार्यों को ढूंढ रहा है और एसोसिएशन चर के बीच रिश्तों की तलाश कर रहा है। डाटा माइनिंग आमतौर पर उन सवालों के जवाब देने के लिए उपयोग की जाती है जैसे वाल-मार्ट में अगले साल उच्च लाभ प्राप्त करने में मुख्य उत्पाद क्या हैं?

जैसा कि ऊपर बताया गया है, डाटा वॉरहाउसिंग का भी डेटा का विश्लेषण करने के लिए उपयोग किया जाता है, लेकिन उपयोगकर्ताओं के अलग-अलग सेटों और दिमाग में एक अलग लक्ष्य से। उदाहरण के लिए, जब खुदरा क्षेत्र की बात आती है, डेटा वेयरहाउसिंग उपयोगकर्ता ग्राहकों के बीच किस तरह की खरीदारी खरीदते हैं, इसके बारे में अधिक चिंतित हैं, इसलिए विश्लेषण के परिणाम ग्राहक अनुभव को सुधार कर ग्राहक की सहायता कर सकते हैं। लेकिन डाटा खनिक पहले एक अनुमान को अनुमान लगाते हैं, जैसे ग्राहक एक निश्चित प्रकार के उत्पाद खरीदते हैं और परिकल्पना का परीक्षण करने के लिए डेटा का विश्लेषण करते हैं। डेटा वेयरहाउसिंग एक प्रमुख रिटेलर द्वारा किया जा सकता है जो शुरू में अपने स्टोर को उसी आकार के उत्पादों के साथ शेयर करता है बाद में पता चलता है कि न्यूयॉर्क स्टोर छोटी दुकानों की तुलना में शिकागो स्टोरों की तुलना में बहुत अधिक बेचता है तो, इस नतीजे को देखते हुए रिटेलर शिकागो स्टोरों की तुलना में न्यू यॉर्क स्टोर को छोटे आकार के साथ स्टॉक कर सकता है।

-3 ->

तो, जैसा कि आप स्पष्ट रूप से देख सकते हैं, इन दो प्रकार के विश्लेषण नग्न आंखों में एक ही प्रकृति का दिखाई देते हैं। दोनों ऐतिहासिक डेटा के आधार पर मुनाफा बढ़ने की चिंता करते हैं। लेकिन ज़ाहिर है, महत्वपूर्ण अंतर हैं सरल शब्दों में, डाटा माइनिंग और डेटा वेयरहाउसिंग विभिन्न प्रकार के विश्लेषिकी प्रस्तुत करने के लिए समर्पित हैं, लेकिन निश्चित रूप से विभिन्न प्रकार के उपयोगकर्ताओं के लिए। दूसरे शब्दों में, डेटा खनन सहसंबंधों के लिए दिखता है, एक सांख्यिकीय परिकल्पना के समर्थन के लिए पैटर। लेकिन, डेटा भण्डारण एक तुलनात्मक रूप से विस्तृत प्रश्न का उत्तर देता है और भविष्य में सुधार के तरीकों को पहचानने के लिए वहां से स्लाइस और डाइस डेटा का उपयोग करता है