यादृच्छिक डेटा वितरण
डेटा वितरण क्या है?
डेटा वितरण सभी संभावित मानों की एक सूची है, और प्रत्येक मान कितनी बार आता है।
सांख्यिकी और डेटा विज्ञान के साथ काम करते समय ऐसी सूचियाँ महत्वपूर्ण हैं।
रैंडम मॉड्यूल उन तरीकों की पेशकश करता है जो बेतरतीब ढंग से उत्पन्न डेटा वितरण लौटाते हैं।
यादृच्छिक वितरण
एक यादृच्छिक वितरण यादृच्छिक संख्याओं का एक समूह है जो एक निश्चित संभाव्यता घनत्व फ़ंक्शन का पालन करता है ।
प्रायिकता घनत्व फलन: एक फलन जो एक सतत प्रायिकता का वर्णन करता है। यानी एक सरणी में सभी मूल्यों की संभावना।
हम मॉड्यूल की choice()
विधि का
उपयोग करके परिभाषित संभावनाओं के आधार पर यादृच्छिक संख्याएँ उत्पन्न कर सकते हैं
।random
choice()
विधि हमें प्रत्येक मान के लिए संभाव्यता निर्दिष्ट करने की अनुमति देती है ।
प्रायिकता 0 और 1 के बीच की संख्या द्वारा निर्धारित की जाती है, जहां 0 का अर्थ है कि मान कभी नहीं होगा और 1 का अर्थ है कि मान हमेशा घटित होगा।
उदाहरण
एक 1-डी सरणी उत्पन्न करें जिसमें 100 मान हों, जहाँ प्रत्येक मान 3, 5, 7 या 9 होना चाहिए।
मान के 3 होने की प्रायिकता 0.1 . पर सेट है
मान के 5 होने की प्रायिकता 0.3 . निर्धारित की गई है
मान के 7 होने की प्रायिकता 0.6 . निर्धारित की गई है
मान के 9 होने की प्रायिकता 0 . पर सेट है
from numpy import random
x = random.choice([3, 5, 7, 9], p=[0.1, 0.3,
0.6, 0.0], size=(100))
print(x)
सभी प्रायिकता संख्याओं का योग 1 होना चाहिए।
यदि आप उदाहरण को 100 बार से ऊपर चलाते हैं, तो मान 9 कभी नहीं आएगा।
size
आप पैरामीटर में आकार निर्दिष्ट करके किसी भी आकार और आकार के सरणी वापस कर सकते हैं
।
उदाहरण
ऊपर जैसा ही उदाहरण है, लेकिन 3 पंक्तियों के साथ 2-डी सरणी लौटाएं, प्रत्येक में 5 मान हैं।
from numpy import random
x = random.choice([3, 5, 7, 9], p=[0.1, 0.3,
0.6, 0.0], size=(3, 5))
print(x)