जब आपने अपने सिस्टम या प्रक्रिया पर डेटा एकत्र किया है, तो अगला कदम यह निर्धारित करना है कि किस प्रकार की संभाव्यता वितरण है। संभाव्यता वितरण के प्रकार हैं: असतत वर्दी, बर्नौली, द्विपद, ऋणात्मक द्विपद, पॉइसोन, ज्यामितीय, सतत एकसमान, सामान्य (घंटी वक्र), घातीय, गामा और बीटा वितरण। संभावनाओं की सूची में से कुछ को संकीर्ण करना यह निर्धारित करता है कि निकटतम आर स्क्वेर्ड मूल्य कितना तेज है।
आपको जिन वस्तुओं की आवश्यकता होगी
-
रेखांकन सॉफ्टवेयर
-
आर चुकता मूल्य की गणना करने के साधन (सर्वोत्तम फिट विश्लेषण)
डेटा प्रकार के दृश्य प्रतिनिधित्व के लिए डेटा प्लॉट करें।
यह निर्धारित करने के लिए कि डेटा वितरण का पहला चरण क्या है - और इस प्रकार डेटा का उपयोग करने के लिए समीकरण प्रकार - यह पता लगाने के लिए है कि यह क्या नहीं हो सकता है। • यदि डेटा सेट में कोई चोटियां हैं, तो यह असतत समान वितरण नहीं हो सकता है। • यदि डेटा में एक से अधिक शिखर हैं, तो यह पॉइसन या द्विपद नहीं है। • यदि इसमें एक एकल वक्र है, कोई माध्यमिक चोटियां नहीं हैं, और प्रत्येक तरफ एक धीमी ढलान है, तो यह पॉइसन या गामा वितरण हो सकता है। लेकिन यह एक समान वितरण नहीं हो सकता। • यदि डेटा समान रूप से वितरित किया जाता है, और यह एक तरफ की तरफ तिरछा बिना होता है, तो गामा या वेइबुल वितरण को नियंत्रित करना सुरक्षित होता है। • यदि फ़ंक्शन के रेखांकन परिणामों के बीच में एक समान वितरण या शिखर है, तो यह एक ज्यामितीय वितरण या एक घातांक वितरण नहीं है। • यदि एक कारक की घटना एक पर्यावरणीय चर के साथ बदलती है, तो संभवतः यह एक पॉइसन वितरण नहीं है।
संभाव्यता वितरण प्रकार को कम करने के बाद, संभाव्यता वितरण के प्रत्येक संभावित प्रकार का एक आर चुकता विश्लेषण करें। उच्चतम आर चुकता मूल्य के साथ सबसे अधिक संभावना सही है।
एक बाह्य डेटा बिंदु को हटा दें। फिर आर वर्ग चुकाना। यदि समान संभावना वितरण प्रकार निकटतम मैच के रूप में आता है, तो एक उच्च विश्वास है कि यह डेटा सेट के लिए उपयोग करने के लिए सही संभावना वितरण है।
टिप्स
-
यदि डेटा कई चोटियों को व्यापक बिखराव दिखाता है, तो यह संभव है कि दो अलग-अलग प्रक्रियाएं चल रही हों या उत्पाद का नमूना लिया जा रहा हो। डेटा को फिर से याद करें और फिर से विश्लेषण करें।
चेतावनी
बाद में डेटा सेट के खिलाफ उत्पन्न समीकरणों की पुष्टि करें कि यह डेटा सेट के लिए अभी भी सटीक है। यह संभव है कि पर्यावरणीय कारकों और प्रक्रिया के बहाव ने मौजूदा समीकरणों और मॉडलों को गलत बना दिया हो।