डेटा की परिशुद्धता की गणना कैसे करें

विषयसूची:

Anonim

डेटा परिशुद्धता वैज्ञानिक या सांख्यिकीय विश्लेषण करते समय सबसे महत्वपूर्ण विचारों में से एक है। सटीकता की समान रूप से महत्वपूर्ण अवधारणा के साथ उलझन में, हवाई विश्वविद्यालय द्वारा व्यक्त की गई डार्ट बोर्ड सादृश्यता प्रदर्शित करती है: सटीक डेटा बिंदु समान अपेक्षित परिणामों के लिए औसत होते हैं, जबकि सटीक डेटा बिंदु एक साथ क्लस्टर करते हैं, भले ही वे पास न हों। प्रत्याशित परिणाम। डार्टमाउथ कॉलेज के अनुसार, सटीक एक परिणाम के एक सेट के प्रतिलिपि प्रस्तुत करने योग्यता का माप है। भौगोलिक सूचना प्रणाली के विश्लेषण में टेक्सास-ऑस्टिन विश्वविद्यालय के साथ केनेथ ई। फूटे और डोनाल्ड जे। ह्यूबनेर द्वारा दिखाए गए अनुसार प्रौद्योगिकी से संबंधित प्रयासों में भी डेटा सेट में शुद्धता एक महत्वपूर्ण अवधारणा है। सटीक गणना करना काफी सरल है, हालांकि कुछ व्यक्तिपरक व्यायाम।

आपको जिन वस्तुओं की आवश्यकता होगी

  • डेटा सेट का चित्रमय प्रतिनिधित्व

  • आंकड़ों में व्यक्त प्रासंगिक इकाइयों की जानकारी

  • प्रयोग में त्रुटि का न्यूनतम स्वीकार्य मार्जिन

स्कैटर प्लॉट जैसे डेटा बिंदुओं का दृश्य प्रतिनिधित्व विकसित करें। एक बहुत ही सरल दृश्य प्रतिनिधित्व में कार्टेशियन समन्वय प्रणाली पर प्रत्येक डेटा बिंदु के लिए संगत निर्भर और स्वतंत्र चर मानों को शामिल करना शामिल है।

डेटा बिंदुओं के समूह का आकलन करें और पैटर्न देखें। डेटा बिंदुओं के समूहों में सटीक डेटा प्रकट होता है, जो दर्शाता है कि समान इनपुट चर समान आउटपुट चर से संबंधित हैं।

डेटा बिंदुओं के बीच औसत रिक्ति निर्धारित करने के लिए डेटा एकत्र करने के लिए उपयोग की जाने वाली माप की इकाइयों पर जानकारी लागू करें। एक सरल शासक माप का उपयोग ग्राफ पर बिंदुओं के बीच की दूरी को निर्धारित करने के लिए किया जा सकता है, फिर डेटा बिंदुओं को उत्पन्न करने के लिए उपयोग किए जाने वाले मापों की इकाइयों से मेल खाती एक मनमाना, सुविधाजनक पैमाने का उपयोग करके परिवर्तित किया जाता है। यह डेटा बिंदुओं की सटीकता को एक दूसरे के सापेक्ष दूरी के औसत को ले कर गणना करने की अनुमति देगा।

प्रयोग में दी गई त्रुटि के न्यूनतम मार्जिन और डेटा की औसत सटीकता की तुलना करें ताकि प्रयोग की सापेक्ष समग्र सटीकता का निर्धारण किया जा सके। विभिन्न प्रकार के प्रयोगों में अधिक या कम त्रुटि सहिष्णुता होगी: एक इंजीनियरिंग परियोजना को संभवतः बहुत छोटी इकाइयों के लिए सटीक नीचे की आवश्यकता होगी, जबकि एक सामाजिक प्रयोग संभवतः अधिक विचरण को सहन करेगा।

टिप्स

  • डेटा बिंदुओं का ग्राफिक प्रतिनिधित्व बनाने से पहले संभावित इकाई पैमाने का आकलन करने का प्रयास करें। यह विशेष रूप से उल्लेखनीय परिशुद्धता या संसेचन के किसी भी क्षेत्र की पहचान करने के लिए सटीक रूप से परिशुद्धता का आकलन करना आसान बना देगा।

    एक दृश्य प्रतिनिधित्व पर होने वाले डेटा के स्पष्ट पैटर्न अत्यधिक सटीकता और एक प्रयोग की पुनरावृत्ति के संकेत हैं। निरंतर प्रयोग से पहले से मौजूद अस्तित्व के करीब सटीक समूहों में और डेटा बिंदुओं को जोड़ना चाहिए।

चेतावनी

सटीकता के साथ सटीकता को भ्रमित न करें। यदि किसी प्रयोग का लक्ष्य सभी इनपुट के लिए औसत आउटपुट मूल्य देना है, और यह -12 से 14 तक के औसत मानों द्वारा प्राप्त किया जाता है, तो यह सटीक माप होने की संभावना नहीं है, हालांकि यह सटीक हो सकता है। एक सटीक माप में 17 के आसपास सभी डेटा बिंदुओं का परिणाम हो सकता है, जो कि गलत होगा, लेकिन सटीक और इसलिए पूर्वानुमान योग्य होगा।