केन्द्रीय प्रवृत्ति और फैलाव के बीच का अंतर

Anonim

केन्द्रीय प्रवृत्ति बनाम विच्छेदन के लिए निर्धारित डेटा का वर्णन करने के लिए, वर्णनात्मक और अनुमानित आंकड़ों में, कई सूचकांकों का उपयोग इसके केंद्रीय प्रवृत्ति, फैलाव, और तिरछा: तीन सबसे महत्वपूर्ण गुण जो डेटा सेट के वितरण के सापेक्ष आकार का निर्धारण करते हैं।

केंद्रीय प्रवृत्ति क्या है?

केंद्रीय प्रवृत्ति मूल्यों के वितरण के केंद्र को संदर्भित करती है और पता करती है। एक डेटा सेट की केंद्रीय प्रवृत्ति का वर्णन करने में माध्य, मोड और माध्य सबसे अधिक उपयोग किए जाने वाले इंडेक्स हैं। यदि एक डेटा सेट सममित है, तो दोनों मध्य और डेटा सेट का मतलब एक दूसरे के साथ मेल खाता है।

डेटा सेट को देखते हुए, मतलब सभी डेटा मूल्यों का योग लेते हुए और फिर आंकड़ों की संख्या से इसे विभाजित करके गणना की जाती है। उदाहरण के लिए, 10 लोग (किलोग्राम में) के वजन को 70, 62, 65, 72, 80, 70, 63, 72, 77 और 79 मापा जाता है। फिर दस लोगों का औसत वजन (किलोग्राम में) हो सकता है इस प्रकार की गणना वजन का योग 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79 = 710 है। माध्य = (राशि) / (आंकड़ों की संख्या) = 710/10 = 71 (किलोग्राम में) यह समझा जाता है कि आउटलेटर्स (डेटा पॉइंट जो सामान्य प्रवृत्ति से विचलित होते हैं) मतलब को प्रभावित करते हैं। इस प्रकार, आउटलेटर्स की उपस्थिति में अकेले डेटा सेट के केंद्र के बारे में सही तस्वीर नहीं दी जाएगी।

-2 ->

माध्य डेटा डेटा के सटीक मध्य में पाया डेटा बिंदु है। औसत गणना करने का एक तरीका डेटा को आरोही क्रम में ऑर्डर करना है, और फिर बीच में डेटा बिन्दु का पता लगाएं। उदाहरण के लिए, यदि एक बार पिछले डेटा सेट का आदेश दिया गया, तो 62, 63, 65, 70, 70, 72, 72, 77, 79, 80 जैसा दिखता है। इसलिए, (70 + 72) / 2 = 71 बीच में है, इससे, यह देखा जाता है कि मध्यस्थ डेटा सेट में नहीं होना चाहिए। आउटलाइनर की उपस्थिति से मध्यस्थ प्रभावित नहीं होता है इसलिए, औसत से आउटरीयर की उपस्थिति में मध्य प्रवृत्ति का बेहतर उपाय होगा

मोड डेटा के सेट में सबसे अधिक बार होने वाला मूल्य है। पिछले उदाहरण में, मूल्य 70 और 72 दोनों ही दो बार होते हैं और इस प्रकार, दोनों मोड हैं यह दर्शाता है कि, कुछ वितरण में, एक से अधिक मॉडल मूल्य है। यदि केवल एक ही मोड है, तो डेटा सेट को बेमतुल कहा जाता है, इस मामले में, डेटा सेट बिमोडाल है

फैलाव क्या है?

फैलाव वितरण के केंद्र के बारे में डेटा के प्रसार की मात्रा है रेंज और मानक विचलन फैलाव के सबसे अधिक इस्तेमाल किए जाने वाले उपाय हैं।

सीमा केवल सबसे ऊंची मूल्य घटा न्यूनतम मूल्य है पिछले उदाहरण में, उच्चतम मान 80 है और सबसे कम मूल्य 62 है, इसलिए सीमा 80-62 = 18 है। लेकिन रेंज फैलाव के बारे में पर्याप्त तस्वीर प्रदान नहीं करती है।

मानक विचलन की गणना करने के लिए, पहले मतलब से डेटा मूल्यों के विचलन की गणना की जाती है विचलन का मूल वर्ग मतलब मानक विचलन कहा जाता है। पिछले उदाहरण में, मतलब से संबंधित विचलन (70 - 71) = -1, (62 - 71) = -9, (65 - 71) = -6, (72 - 71) = 1, (80 - 71) = 9, (70 - 71) = -1, (63 - 71) = -8, (72 - 71) = 1, (77 - 71) = 6 और (79 - 71) = 8. का योग विचलन के वर्ग (-1)

2 + (-9) 2 + (-6) 2 + 1 2 + 9 2 + (-1) 2 + (-8) 2 + 1 2 + 6 2 + 8 2 = 366. मानक विचलन √ (366/10) = 6. 05 (किलोग्राम में) है। जब तक डेटा सेट बहुत सीधा नहीं होता, तब से यह निष्कर्ष निकाला जा सकता है कि अधिकांश डेटा अंतराल 71 ± 6 में है। 05, और यह वास्तव में इस विशेष उदाहरण में है। केंद्रीय प्रवृत्ति और फैलाव के बीच क्या अंतर है?

• केंद्रीय प्रवृत्ति मूल्यों के वितरण के केन्द्र को संदर्भित करती है और उसे रेखांकित करती है

फैलाव एक डेटा सेट के केंद्र के बारे में डेटा के प्रसार की मात्रा है।