यंत्र अधिगम
मशीन लर्निंग कंप्यूटर को डेटा और आँकड़ों के अध्ययन से सीख रहा है।
मशीन लर्निंग आर्टिफिशियल इंटेलिजेंस (एआई) की दिशा में एक कदम है।
मशीन लर्निंग एक प्रोग्राम है जो डेटा का विश्लेषण करता है और परिणाम की भविष्यवाणी करना सीखता है।
कहां से शुरू करें?
इस ट्यूटोरियल में हम गणित पर वापस जाएंगे और आँकड़ों का अध्ययन करेंगे, और डेटा सेट के आधार पर महत्वपूर्ण संख्याओं की गणना कैसे करेंगे।
हम यह भी सीखेंगे कि हमें आवश्यक उत्तर प्राप्त करने के लिए विभिन्न पायथन मॉड्यूल का उपयोग कैसे करें।
और हम सीखेंगे कि कैसे कार्य करना है जो हमने जो सीखा है उसके आधार पर परिणाम की भविष्यवाणी करने में सक्षम हैं।
डेटा सेट
कंप्यूटर के दिमाग में, डेटा सेट डेटा का कोई संग्रह होता है। यह किसी सरणी से संपूर्ण डेटाबेस तक कुछ भी हो सकता है।
एक सरणी का उदाहरण:
[99,86,87,88,111,86,103,87,94,78,77,85,86]
डेटाबेस का उदाहरण:
कार्नेम | रंग | उम्र | स्पीड | ऑटोपास |
बीएमडब्ल्यू | लाल | 5 | 99 | यू |
वोल्वो | काला | 7 | 86 | यू |
वीडब्ल्यू | धूसर | 8 | 87 | एन |
वीडब्ल्यू | गोरा | 7 | 88 | यू |
पायाब | गोरा | 2 | 111 | यू |
वीडब्ल्यू | गोरा | 17 | 86 | यू |
टेस्ला | लाल | 2 | 103 | यू |
बीएमडब्ल्यू | काला | 9 | 87 | यू |
वोल्वो | धूसर | 4 | 94 | एन |
पायाब | गोरा | 1 1 | 78 | एन |
टोयोटा | धूसर | 12 | 77 | एन |
वीडब्ल्यू | गोरा | 9 | 85 | एन |
टोयोटा | नीला | 6 | 86 | यू |
सरणी को देखकर, हम अनुमान लगा सकते हैं कि औसत मूल्य लगभग 80 या 90 है, और हम उच्चतम मूल्य और निम्नतम मूल्य भी निर्धारित करने में सक्षम हैं, लेकिन हम और क्या कर सकते हैं?
और डेटाबेस को देखकर हम देख सकते हैं कि सबसे लोकप्रिय रंग सफेद है, और सबसे पुरानी कार 17 साल की है, लेकिन क्या होगा अगर हम अनुमान लगा सकते हैं कि कार में ऑटोपास था, बस अन्य मूल्यों को देखकर?
मशीन लर्निंग इसी के लिए है! डेटा का विश्लेषण और परिणाम की भविष्यवाणी!
मशीन लर्निंग में बहुत बड़े डेटा सेट के साथ काम करना आम बात है। इस ट्यूटोरियल में हम मशीन लर्निंग की विभिन्न अवधारणाओं को यथासंभव आसान बनाने की कोशिश करेंगे, और हम छोटे आसानी से समझने वाले डेटा सेट के साथ काम करेंगे।
जानकारी का प्रकार
डेटा का विश्लेषण करने के लिए, यह जानना महत्वपूर्ण है कि हम किस प्रकार के डेटा से निपट रहे हैं।
हम डेटा प्रकारों को तीन मुख्य श्रेणियों में विभाजित कर सकते हैं:
- न्यूमेरिकल
- स्पष्ट
- क्रमवाचक
संख्यात्मक डेटा संख्याएं हैं, और इन्हें दो संख्यात्मक श्रेणियों में विभाजित किया जा सकता है:
- असतत डेटा
- संख्याएं जो पूर्णांक तक सीमित हैं। उदाहरण: गुजरने वाली कारों की संख्या। - सतत डेटा
- वे संख्याएँ जो अनंत मूल्य की होती हैं। उदाहरण: किसी वस्तु की कीमत, या किसी वस्तु का आकार
श्रेणीबद्ध डेटा वे मान हैं जिन्हें एक दूसरे के विरुद्ध नहीं मापा जा सकता है। उदाहरण: एक रंग मान, या कोई हाँ/नहीं मान।
सामान्य डेटा श्रेणीबद्ध डेटा की तरह होते हैं, लेकिन एक दूसरे के विरुद्ध मापा जा सकता है। उदाहरण: स्कूल के ग्रेड जहां ए, बी से बेहतर है और इसी तरह।
अपने डेटा स्रोत के डेटा प्रकार को जानकर, आप यह जान पाएंगे कि उनका विश्लेषण करते समय किस तकनीक का उपयोग करना है।
आप अगले अध्यायों में आंकड़ों और आंकड़ों के विश्लेषण के बारे में और जानेंगे।