एक्सेल में अवशिष्ट भिन्नता कैसे खोजें

विषयसूची:

Anonim

सांख्यिकीय विश्लेषण में, ए झगड़ा डेटा सेट के सदस्यों के बीच पता चलता है कि ट्रेंड लाइन से डेटा पॉइंट्स कितनी दूर हैं, इसे ट्रेंड भी कहा जाता है बढतीरेखा । विचरण जितना अधिक होता है, डेटा बिंदु उतने ही अधिक फैलते हैं। विचरण के विश्लेषण के अध्ययन से पता चलता है कि विचरण के किन हिस्सों को आंकड़ों की विशेषताओं द्वारा समझाया जा सकता है, और जिन्हें यादृच्छिक कारकों के लिए जिम्मेदार ठहराया जा सकता है। विचरण के जिस भाग को समझाया नहीं जा सकता, उसे अवशिष्ट विचरण कहा जाता है.

अवशिष्ट विचरण की गणना करने के लिए एक्सेल स्प्रेडशीट का उपयोग करना

अवशिष्ट विचरण की गणना के सूत्र में कई जटिल गणनाएँ शामिल हैं। छोटे डेटा सेट के लिए, हाथ से अवशिष्ट विचरण की गणना करने की प्रक्रिया थकाऊ हो सकती है। बड़े डेटा सेट के लिए, कार्य समाप्त हो सकता है। एक एक्सेल स्प्रेडशीट का उपयोग करके, आपको केवल डेटा बिंदु दर्ज करने और सही सूत्र का चयन करने की आवश्यकता है। कार्यक्रम जटिल गणना को संभालता है और जल्दी से एक परिणाम देता है।

डेटा अंक

एक नया एक्सेल स्प्रेडशीट खोलें और डेटा बिंदुओं को दो कॉलम में दर्ज करें। प्रतिगमन लाइनों के लिए आवश्यक है कि प्रत्येक डेटा बिंदु में दो तत्व हों। सांख्यिकीविद् आमतौर पर इन तत्वों को "X" और "Y" लेबल करते हैं। उदाहरण के लिए, जेनेरिक इंश्योरेंस कंपनी अपने कर्मचारियों की ऊंचाई और वजन के अवशिष्ट संस्करण का पता लगाना चाहती है। X चर ऊंचाई का प्रतिनिधित्व करता है और Y चर भार का प्रतिनिधित्व करता है। कॉलम ए में ऊंचाई और कॉलम बी में वजन दर्ज करें।

मतलब ढूंढना

मतलब डेटा सेट में प्रत्येक तत्व के लिए औसत का प्रतिनिधित्व करता है। इस उदाहरण में, जेनेरिक इंश्योरेंस 10 कर्मचारियों की हाइट और वेट के औसत, मानक विचलन और कोवरियन को खोजना चाहता है। स्तंभ A में सूचीबद्ध ऊंचाइयों का औसत सेल एफ 1 में "= AVERAGE (A1: A10)" फ़ंक्शन में प्रवेश करके पाया जा सकता है। कॉलम बी में सूचीबद्ध वजन का औसत फ़ंक्शन "= AVERAGE (B1: B10)" को सेल F3 में दर्ज करके पाया जा सकता है।

मानक विचलन और सह-अस्तित्व का पता लगाना

मानक विचलन उपाय, डेटा बिंदुओं से कितनी दूर तक फैले हुए हैं। सहप्रसरण मापता है कि डेटा बिंदु के दो तत्व एक साथ कितना बदलते हैं। सेल F2 में फ़ंक्शन "= STDEV (A1: A10)" दर्ज करके ऊंचाइयों का मानक विचलन पाया जाता है। सेल F4 में फ़ंक्शन "= STDEV (B1: B10)" दर्ज करके वज़न का मानक विचलन पाया जाता है। सेल F5 में "= COVAR (A1: A10; B1: B10)" फंक्शन में प्रवेश करके हाइट्स और वेट के बीच का कोविरेंस पाया जाता है।

प्रतिगमन लाइन ढूँढना

बढतीरेखा एक रैखिक फ़ंक्शन का प्रतिनिधित्व करता है जो डेटा बिंदुओं की प्रवृत्ति का अनुसरण करता है। प्रतिगमन रेखा का सूत्र इस तरह दिखता है: Y = aX + b।

उपयोगकर्ता साधनों, मानक विचलन और सहसंयोजक के लिए गणना का उपयोग करके "ए" और "बी" के लिए मान पा सकता है। "बी" का मान उस बिंदु का प्रतिनिधित्व करता है जहां प्रतिगमन रेखा वाई-अक्ष को स्वीकार करती है। मूल्य को सह-ग्रहण करके और एक्स-मानों के मानक विचलन के वर्ग द्वारा विभाजित करके पाया जा सकता है। Excel सूत्र सेल F6 में जाता है और इस तरह दिखता है: = F5 / F2 ^ 2।

"A" का मान प्रतिगमन रेखा के ढलान को दर्शाता है। Excel सूत्र सेल F7 में जाता है और इस तरह दिखता है: = F3-F6 * F1।

प्रतिगमन रेखा के लिए सूत्र देखने के लिए, सेल F8 में इस स्ट्रिंग संघटन को दर्ज करें:

= CONCATENATE ("Y ="; ROUND (F6; 2); "X"; IF (SIGN (F7) = 1; "+"; "-"); ABS; ROUND (F7; 2)))

Y मानों की गणना करें

अगले चरण में डेटा सेट में दिए गए एक्स-मानों के लिए प्रतिगमन लाइन पर वाई-मूल्यों की गणना करना शामिल है। Y मान ढूँढने का सूत्र स्तंभ C में जाता है और इस तरह दिखता है:

= $ एफ $ 6 * एक (i) + $ एफ $ 7

जहां A (i) रो (i) में कॉलम A के लिए मान है। सूत्र स्प्रेडशीट में इस तरह दिखते हैं:

= $ एफ $ 6 * A1 + $ F $ 7

= $ एफ $ 6 * A2 + $ F $ 7

= $ F $ 6 * A3 + $ F $ 7, और इसी तरह

कॉलम D में प्रविष्टियाँ Y के लिए अपेक्षित और वास्तविक मानों के बीच अंतर दिखाती हैं। सूत्र इस तरह दिखते हैं:

= बी (i) -सी (i)

जहां क्रमशः कॉलम B और C में B (i) और C (i) रो (i) के मान हैं।

अवशिष्ट विचरण ढूँढना

अवशिष्ट विचरण का सूत्र सेल F9 में जाता है और इस तरह दिखता है:

= SUMSQ (डी 1: D10) / (COUNT (डी 1: D10) -2)

जहां SUMSQ (D1: D10) वास्तविक और अपेक्षित Y मानों के बीच अंतर के वर्गों का योग है, और (COUNT (D1: D10) -2) डेटा अंकों की संख्या, स्वतंत्रता की डिग्री के लिए माइनस 2 है डेटा।