नमूनाकरण एक और अधिक विश्लेषण के लिए डेटा के एक बड़े सेट से प्रविष्टियों की एक विशिष्ट संख्या का चयन करने के कार्य को संदर्भित करता है। व्यावसायिक अनुसंधान अक्सर विशाल मात्रा में डेटा उत्पन्न करता है, विशेष रूप से जनसांख्यिकी जैसे बाजार केंद्रित अनुसंधान में। व्यवसाय अनुसंधान में नमूनाकरण तकनीक शोधकर्ताओं को डेटा के अधिक प्रबंधनीय उपसमुच्चय के साथ काम करने की अनुमति देती है, जो मानते हैं कि वे बड़े संग्रह में प्रवृत्तियों का सही प्रतिनिधित्व करते हैं।
प्राथमिक अनुसंधान
व्यवसाय अनुसंधान डेटा प्राप्त करते हैं जिसमें से दो अलग-अलग तरीकों से नमूने लेने होते हैं। पहला, प्राथमिक अनुसंधान, इसके स्रोतों से डेटा खोदना शामिल है। सर्वेक्षण प्राथमिक अनुसंधान का सबसे लोकप्रिय रूप है, चाहे वह व्यक्ति में, फोन पर, इंटरनेट के माध्यम से या किसी अन्य माध्यम से किया गया हो। प्राथमिक अनुसंधान के परिणाम मालिकाना होते हैं, जिसका अर्थ है कि किसी अन्य कंपनी के पास प्राथमिक अनुसंधान के परिणामों तक पहुंच नहीं है जब तक कि यह विशेष रूप से शोधकर्ता द्वारा प्रदान नहीं किया जाता है या जनता के लिए उपलब्ध नहीं है।
द्वितीय शोध
जब प्राथमिक शोध परिणाम अन्य शोधकर्ताओं के साथ साझा किए जाते हैं, तो अन्य शोधकर्ता माध्यमिक अनुसंधान कर रहे हैं। माध्यमिक अनुसंधान अनिवार्य रूप से उन अन्य लोगों के प्रयासों पर निर्भर करता है जिन्होंने प्रासंगिक और मूल्यवान डेटा के बड़े सेटों को संकलित करने के लिए समय लिया है। श्रम सांख्यिकी ब्यूरो से औसत आय के आंकड़े देखना माध्यमिक अनुसंधान का एक उदाहरण है। चूंकि ब्यूरो ने पहले से ही डेटा का व्यापक सर्वेक्षण और संकलन किया है, इसलिए अन्य व्यावसायिक शोधकर्ता बहुत कम या बिना लागत के डेटा का लाभ उठा सकते हैं।
यादृच्छिक नमूना
यादृच्छिक नमूने में पूरी तरह से यादृच्छिक पर डेटा वस्तुओं की एक निश्चित संख्या को चुनना शामिल है, फिर आगे के विश्लेषण के लिए नमूने का उपयोग करना। रैंडम सैंपलिंग एक प्रभावी तकनीक हो सकती है जब डेटा के काफी सजातीय सेटों का विश्लेषण किया जाता है। एक ऐसी कंपनी की कल्पना करें, जो किसी विशेष राज्य में रुग्ण मोटापे से ग्रस्त लोगों के प्रतिशत का निर्धारण करती है। कई मिलियन प्रविष्टियों के डेटा सेट के साथ काम करने के बजाय, कंपनी एक ऐसे नंबर पर आने के लिए कई सौ प्रविष्टियों के यादृच्छिक नमूने का यथोचित विश्लेषण कर सकती है, जो संपूर्ण डेटा सेट के आंकड़े का अनुमान लगाता है।
Nth नाम नमूनाकरण
Nth नाम का नमूना, जिसे व्यवस्थित नमूनाकरण भी कहा जाता है, यादृच्छिक नमूनाकरण के समान है, सिवाय इसके कि यह मध्यस्थ डेटा चयन के प्रभाव को कम करता है। व्यवस्थित नमूने में एक नमूना में शामिल करने के लिए प्रत्येक nth डेटा प्रविष्टि का चयन करना शामिल है। यदि आपके पास एक मिलियन सर्वेक्षण प्रतिक्रियाओं का डेटा सेट है, उदाहरण के लिए, आप नमूने में शामिल करने के लिए हर हजारवें प्रविष्टि का चयन कर सकते हैं, जिससे आपको एक हजार प्रविष्टियों के अधिक प्रबंधनीय नमूने के साथ छोड़ दिया जाएगा।
सैंपलिंग को नियंत्रित किया
नियंत्रित नमूना डेटा के काफी विषम सेट से अत्यधिक विशिष्ट नमूने लेता है। माध्यमिक अनुसंधान करते समय नियंत्रित नमूना सबसे मूल्यवान होता है, क्योंकि प्राथमिक अनुसंधान को केवल विशिष्ट उत्तरदाताओं को लक्षित करने के लिए डिज़ाइन किया जा सकता है।
एक ऐसी कंपनी की कल्पना करें, जो सर्वेक्षण के उत्तरदाताओं की उम्र, जातीयता, शिक्षा और आय के स्तर पर जानकारी युक्त एक बड़ा डेटा सेट खरीदती है। यदि कोई कंपनी किसी निश्चित आयु वर्ग के लिए औसत आय स्तर निर्धारित करना चाहती थी, तो कंपनी केवल आयतों की गणना करने से पहले विशिष्ट आयु मानदंडों को पूरा करने वाली प्रविष्टियों से मिलकर एक नमूना बना सकती है।