मशीन लर्निंग - मानक विचलन
मानक विचलन क्या है?
मानक विचलन एक संख्या है जो बताती है कि मान कितने फैले हुए हैं।
निम्न मानक विचलन का अर्थ है कि अधिकांश संख्याएँ माध्य (औसत) मान के करीब हैं।
एक उच्च मानक विचलन का अर्थ है कि मान एक व्यापक श्रेणी में फैले हुए हैं।
उदाहरण: इस बार हमने 7 कारों की गति दर्ज की है:
speed = [86,87,88,86,87,85,86]
मानक विचलन है:
0.9
अर्थ यह है कि अधिकांश मान औसत मान से 0.9 की सीमा के भीतर हैं, जो कि 86.4 है।
आइए हम व्यापक श्रेणी वाली संख्याओं के चयन के साथ भी ऐसा ही करें:
speed = [32,111,138,28,59,77,97]
मानक विचलन है:
37.85
अर्थ यह है कि अधिकांश मान माध्य मान से 37.85 की सीमा के भीतर हैं, जो कि 77.4 है।
जैसा कि आप देख सकते हैं, एक उच्च मानक विचलन इंगित करता है कि मान एक व्यापक श्रेणी में फैले हुए हैं।
NumPy मॉड्यूल में मानक विचलन की गणना करने की एक विधि है:
उदाहरण
std()
मानक विचलन खोजने के लिए NumPy विधि का उपयोग करें :
import numpy
speed = [86,87,88,86,87,85,86]
x = numpy.std(speed)
print(x)
उदाहरण
import numpy
speed = [32,111,138,28,59,77,97]
x = numpy.std(speed)
print(x)
झगड़ा
भिन्नता एक और संख्या है जो इंगित करती है कि मान कितने फैले हुए हैं।
वास्तव में, यदि आप विचरण का वर्गमूल लेते हैं, तो आपको मानक विचलन प्राप्त होता है!
या दूसरी तरफ, यदि आप मानक विचलन को अपने आप से गुणा करते हैं, तो आपको विचरण मिलता है!
विचरण की गणना करने के लिए आपको निम्नानुसार करना होगा:
1. माध्य ज्ञात कीजिए:
(32+111+138+28+59+77+97) / 7 = 77.4
2. प्रत्येक मान के लिए: माध्य से अंतर ज्ञात कीजिए:
32 - 77.4 = -45.4
111 - 77.4 = 33.6
138
- 77.4 = 60.6
28 - 77.4 = -49.4
59 - 77.4 = -18.4
77
- 77.4 = - 0.4
97 - 77.4 = 19.6
3. प्रत्येक अंतर के लिए: वर्ग मान ज्ञात कीजिए:
(-45.4)2 = 2061.16
(33.6)2 = 1128.96
(60.6)2 = 3672.36
(-49.4)2 = 2440.36
(-18.4)2 = 338.56
(- 0.4)2 = 0.16
(19.6)2 = 384.16
4. विचरण इन चुकता अंतरों की औसत संख्या है:
(2061.16+1128.96+3672.36+2440.36+338.56+0.16+384.16)
/ 7 = 1432.2
सौभाग्य से, NumPy के पास विचरण की गणना करने की एक विधि है:
उदाहरण
var()
विचरण खोजने के लिए NumPy विधि का उपयोग करें :
import numpy
speed = [32,111,138,28,59,77,97]
x = numpy.var(speed)
print(x)
मानक विचलन
जैसा कि हमने सीखा है, मानक विचलन को खोजने का सूत्र विचरण का वर्गमूल है:
मैं1432.25 = 37.85
या, जैसा कि पहले के उदाहरण में है, मानक विचलन की गणना करने के लिए NumPy का उपयोग करें:
उदाहरण
std()
मानक विचलन खोजने के लिए NumPy विधि का उपयोग करें :
import numpy
speed = [32,111,138,28,59,77,97]
x = numpy.std(speed)
print(x)
प्रतीक
मानक विचलन को अक्सर सिग्मा प्रतीक द्वारा दर्शाया जाता है :
प्रसरण अक्सर प्रतीक सिग्मा स्क्वायर द्वारा दर्शाया जाता है : 2
अध्याय का सारांश
मानक विचलन और भिन्नता ऐसे शब्द हैं जो अक्सर मशीन लर्निंग में उपयोग किए जाते हैं, इसलिए यह समझना महत्वपूर्ण है कि उन्हें कैसे प्राप्त किया जाए, और उनके पीछे की अवधारणा।