1
एक बाहरी क्षमता को पहचानना सीखें यह आकलन करने से पहले कि एक अवलोकन संबंधी जानकारी एक बाहरी है या नहीं, यह डेटा सेट की जांच करना और संभावित आउटलाइनर को पहचानने के लिए हमेशा उपयोगी होता है। उदाहरण के लिए, एक डेटा सेट पर विचार करें जो एक कमरे में 12 विभिन्न ऑब्जेक्ट्स के तापमान का प्रतिनिधित्व करता है। 11 वस्तुओं के आसपास 21 सी एक तापमान है, लेकिन बारहवीं (शायद एक ओवन) 150 डिग्री सेल्सियस के तापमान है, तो एक त्वरित परीक्षा कह सकते हैं कि भट्ठी एक बाहरी है।
2
सबसे छोटे से सबसे छोटे से अवलोकन डेटा व्यवस्थित करें ऊपर के उदाहरण के साथ सतत, विभिन्न वस्तुओं के तापमान का प्रतिनिधित्व डेटा के निम्नलिखित सेट पर विचार: {22, 21, 24, 21, 21, 20, 21, 23, 22, 150, 22, 20}। यह सेट इस प्रकार वितरित किया जाना चाहिए: {20, 20, 21, 21, 21, 21, 22, 22, 22, 23, 24, 150}।
3
डेटा सेट के मध्य की गणना करें। औसत आंकड़ा के निचले आधे से ऊपर और ऊपरी छमाही के नीचे स्थित अवलोकन संबंधी डेटा है अगर डेटा सेट में एक भी संख्या में अवलोकन होता है, तो बीच में दो शब्दों पर ध्यान केंद्रित किया जाना चाहिए। उपर्युक्त उदाहरण में, माध्यम के दो शब्दों 21 और 22 हैं, तो मध्य (21 + 22) / 2) या 21.5 है।
4
निम्न चतुर्थक की गणना करें यह बिंदु, जिसे Q1 कहा जाता है, अवलोकन के 25% से नीचे मनाया गया अवलोकन संबंधी डेटा है। ऊपर दिए गए उदाहरण में, दो शब्दों को फिर से कारगर होना होगा, इस बार 21 और 21. दोनों के औसत (21 + 21) / 2 होंगे, या 21
5
शीर्ष चतुर्थांश की गणना करें यह बिंदु, जिसे Q3 कहा जाता है, अवलोकन के 25% से ऊपर स्थित अवलोकन संबंधी डेटा है। हमारे उदाहरण के साथ जारी रखते हुए, दो आंकड़ों के औसत 22 और 23 का अनुमान Q3 होता है, जो 22.5 है।
6
डेटा सेट की "आंतरिक बाधाएं" ढूंढें पहला कदम यह है कि क्यू 1 और क्यू 3 (इंटरक्वैटाइल रेंज को बुलाया गया) के अंतर को 1.5 से बढ़ाना। उपरोक्त उदाहरण में, अंतरालीय रेंज (22.5 - 21) है, वह 1.5 है। इस मूल्य को 1.5 से गुणा करके 2.25 उत्पन्न करता है। इस संख्या को Q3 में जोड़ें और बाधाओं को बनाने के लिए Q1 से घटाना इस उदाहरण में, ऊपरी और निचले आंतरिक बाधाएं 24.75 और 18.75 हो जाएंगी।
- सभी अवलोकनिक डेटा जो इस श्रेणी के बाहर हैं, उन्हें मध्यम आउटलेटर्स माना जाता है। इस उदाहरण के डेटा सेट में, केवल ओवन तापमान (150 डिग्री सेल्सियस) को एक मध्यम आउटएला माना जाता है।
7
डेटासेट के "बाहरी बाधाएं" ढूंढें यह आंतरिक बाधाओं के समान ही किया जाता है, सिवाय इसके कि अंतरालीय रेंज को 3 के स्थान पर, 1.5 की बजाय गुणा किया जाता है। उपरोक्त अंतर्विभाजक श्रेणी 3 से गुणा करके, हमारे पास (1.5 * 3), या 4.5 है। इस प्रकार, ऊपरी और निचली बाहरी बाधाएं 27 और 16.5 हैं।
- बाहरी अड़चनों के बाहर स्थित किसी भी अवलोकन संबंधी मान को एक अति बाध्यकारी माना जाता है। इस उदाहरण में, ओवन का तापमान, 150 डिग्री सेल्सियस भी एक अति बाहय है।