ज़िप वितरण
zipf के नियम के आधार पर डेटा का नमूना लेने के लिए Zipf वितरण का उपयोग किया जाता है।
Zipf का नियम: एक संग्रह में n वां सामान्य शब्द सबसे सामान्य शब्द का 1/n गुना है। उदाहरण के लिए अंग्रेजी में 5 वां सामान्य शब्द सबसे अधिक इस्तेमाल किए जाने वाले शब्द के रूप में लगभग 1/5 बार आता है।
इसके दो पैरामीटर हैं:
a
- वितरण पैरामीटर।
size
- लौटे सरणी का आकार।
उदाहरण
आकार 2x3 के साथ वितरण पैरामीटर 2 के साथ ज़िप वितरण के लिए एक नमूना तैयार करें:
from numpy import random
x = random.zipf(a=2, size=(2, 3))
print(x)
ज़िपफ वितरण का विज़ुअलाइज़ेशन
नमूना 1000 अंक लेकिन अधिक सार्थक चार्ट के लिए केवल <10 मान वाले प्लॉटिंग करें।
उदाहरण
from numpy import random
import matplotlib.pyplot as plt
import seaborn as sns
x = random.zipf(a=2, size=1000)
sns.distplot(x[x<10], kde=False)
plt.show()