यादृच्छिक डेटा वितरण

डेटा वितरण क्या है?

डेटा वितरण सभी संभावित मानों की एक सूची है, और प्रत्येक मान कितनी बार आता है।

सांख्यिकी और डेटा विज्ञान के साथ काम करते समय ऐसी सूचियाँ महत्वपूर्ण हैं।

रैंडम मॉड्यूल उन तरीकों की पेशकश करता है जो बेतरतीब ढंग से उत्पन्न डेटा वितरण लौटाते हैं।

एक यादृच्छिक वितरण यादृच्छिक संख्याओं का एक समूह है जो एक निश्चित संभाव्यता घनत्व फ़ंक्शन का पालन करता है ।

प्रायिकता घनत्व फलन: एक फलन जो एक सतत प्रायिकता का वर्णन करता है। यानी एक सरणी में सभी मूल्यों की संभावना।

हम मॉड्यूल की choice()विधि का उपयोग करके परिभाषित संभावनाओं के आधार पर यादृच्छिक संख्याएँ उत्पन्न कर सकते हैं ।random

choice()विधि हमें प्रत्येक मान के लिए संभाव्यता निर्दिष्ट करने की अनुमति देती है ।

प्रायिकता 0 और 1 के बीच की संख्या द्वारा निर्धारित की जाती है, जहां 0 का अर्थ है कि मान कभी नहीं होगा और 1 का अर्थ है कि मान हमेशा घटित होगा।

एक 1-डी सरणी उत्पन्न करें जिसमें 100 मान हों, जहाँ प्रत्येक मान 3, 5, 7 या 9 होना चाहिए।

मान के 3 होने की प्रायिकता 0.1 . पर सेट है

मान के 5 होने की प्रायिकता 0.3 . निर्धारित की गई है

मान के 7 होने की प्रायिकता 0.6 . निर्धारित की गई है

मान के 9 होने की प्रायिकता 0 . पर सेट है

from numpy import random

x = random.choice([3, 5, 7, 9], p=[0.1, 0.3, 0.6, 0.0], size=(100))

print(x)

सभी प्रायिकता संख्याओं का योग 1 होना चाहिए।

यदि आप उदाहरण को 100 बार से ऊपर चलाते हैं, तो मान 9 कभी नहीं आएगा।

sizeआप पैरामीटर में आकार निर्दिष्ट करके किसी भी आकार और आकार के सरणी वापस कर सकते हैं ।

ऊपर जैसा ही उदाहरण है, लेकिन 3 पंक्तियों के साथ 2-डी सरणी लौटाएं, प्रत्येक में 5 मान हैं।

from numpy import random

x = random.choice([3, 5, 7, 9], p=[0.1, 0.3, 0.6, 0.0], size=(3, 5))

print(x)