सेम में जुड़ें और ब्लूम में शामिल हों

Anonim

अर्ध जुड़ें ब्लॉम जुड़ें

अर्ध जुड़ें और ब्लूम में जुड़ने वाले प्रश्नों में संसाधनों को संसाधित करने के लिए क्वेरी प्रसंस्करण में प्रयुक्त दो तरीके शामिल हैं। वितरित डाटाबेस में प्रश्नों को संसाधित करते समय, डेटा को विभिन्न साइटों में स्थित डेटाबेस के बीच स्थानांतरित किया जाना चाहिए। यह डेटा की मात्रा के आधार पर एक महंगी ऑपरेशन हो सकता है, जिसे स्थानांतरित किया जाना चाहिए। इसलिए, जब वितरित डेटाबेस वातावरण में प्रश्नों को संसाधित करते हैं, तो साइटों के बीच स्थानांतरित डेटा की मात्रा को कम करने के लिए क्वेरी को अनुकूलित करना महत्वपूर्ण है। अर्ध जुड़ने और जुड़ने में जुड़ने के दो तरीके हैं जिनका उपयोग डेटा स्थानांतरण की मात्रा को कम करने और कुशल क्वेरी प्रसंस्करण करने के लिए किया जा सकता है।

अर्ध जुड़ें क्या है?

अर्ध सम्मिलित एक वितरित डेटाबेस वातावरण में कुशल क्वेरी प्रसंस्करण के लिए उपयोग की जाने वाली विधि है। ऐसी स्थिति पर विचार करें जहां साइट 1 पर स्थित एक कर्मचारी डेटाबेस (कर्मचारी का नाम, कर्मचारी संख्या, विभाग के लिए काम कर रहा है, आदि) और साइट पर स्थित एक डिपार्टमेंट डाटाबेस (विभाग संख्या, विभाग का नाम, स्थान, आदि जैसी सूचनाएं) 2. उदाहरण के लिए, यदि हम कर्मचारी नाम और विभाग का नाम प्राप्त करना चाहते हैं जो वह साइट 3 पर स्थित एक क्वेरी प्रोसेसर पर एक क्वेरी निष्पादित करके (केवल "न्यूयॉर्क" में स्थित विभागों) के लिए काम कर रही है, तो कई तरीके हैं डेटा को इस कार्य को प्राप्त करने के लिए तीन साइटों के बीच स्थानांतरित किया जा सकता है। लेकिन डेटा स्थानांतरित करते समय, यह ध्यान रखना महत्वपूर्ण है कि साइटों के बीच पूरे डेटाबेस को स्थानांतरित करने के लिए आवश्यक नहीं है। केवल कुछ विशेषताओं (या ट्यूपल्स) जो शामिल होने के लिए आवश्यक हैं, प्रश्नों को कुशलतापूर्वक निष्पादित करने के लिए साइटों के बीच स्थानांतरित किए जाने की आवश्यकता है। अर्ध सम्मिलन एक ऐसी विधि है जिसका इस्तेमाल साइटों के बीच भेजे गए डेटा की मात्रा को कम करने के लिए किया जा सकता है। अर्ध जुड़ने में, केवल शामिल कॉलम को एक साइट से दूसरे स्थान पर स्थानांतरित किया जाता है और फिर स्थानांतरित किए गए कॉलम का उपयोग अन्य साइटों के बीच किए गए रिश्तों के आकार को कम करने के लिए किया जाता है। उपर्युक्त उदाहरण के लिए, आप केवल विभाग संख्या और विभाग का नाम ट्यूपले का स्थान = "न्यू यॉर्क" के साथ साइट 2 से साइट 1 में स्थानांतरित कर सकते हैं और साइट 1 पर शामिल होने और अंतिम रिश्ते वापस 3 साइट पर स्थानांतरित कर सकते हैं।

ब्लूम में क्या शामिल है?

जैसा कि पहले उल्लेख किया गया है, एक वितरित डेटाबेस वातावरण में प्रश्नों को निष्पादित करते समय साइट्स के बीच अनावश्यक डेटा को स्थानांतरित करने से बचने के लिए उपयोग में लाया जाने वाला एक और तरीका है। जुड़ने के कॉलम को स्थानांतरित करने के बजाय खिलने में शामिल होने के साथ, साइट के बीच होने वाली कॉलम के कॉम्पैक्ट प्रतिनिधित्व को स्थानांतरित किया जाता है। ब्लूम इनमें एक ब्लूम फ़िल्टर का उपयोग होता है जो सदस्यता प्रश्नों को निष्पादित करने के लिए थोड़ी वेक्टर को नियोजित करता है। सबसे पहले, एक ब्लूम फ़िल्टर को शामिल होने के कॉलम का उपयोग करके बनाया जाता है और इसे साइट्स के बीच स्थानांतरित किया जाता है और फिर इसमें शामिल होने के संचालन किए जाते हैं।

-3 ->

सेमी में जुड़ें और ब्लूम में क्या अंतर है?

भले ही दोनों अर्ध जुड़ने और जुड़ने के तरीकों का इस्तेमाल एक वितरित डाटाबेस वातावरण में क्वेरी निष्पादित करते समय साइट्स के बीच स्थानांतरित डेटा की मात्रा को कम करने के लिए किया जाता है, लेकिन खिलने में शामिल होने से अर्ध जुड़ने की तुलना में डेटा की मात्रा (ट्यूपल्स की संख्या) कम हो जाती है ब्लूम फिल्टर की अवधारणा का उपयोग करके, जो निर्धारित सदस्यता निर्धारित करने के लिए बिट वेक्टर को नियोजित करते हैं। इसलिए ब्लूम जॉय का उपयोग अर्ध जुड़ने के उपयोग से अधिक कुशल होगा।