एआई डेटा
आर्टिफिशियल इंटेलिजेंस प्रोजेक्ट का 80% तक डेटा एकत्र करने के बारे में है :
- क्या डेटा आवश्यक है ?
- क्या डेटा उपलब्ध है ?
- डेटा का चयन कैसे करें?
- डेटा कैसे एकत्र करें?
- डेटा को कैसे साफ़ करें?
- डेटा कैसे तैयार करें?
- डेटा का उपयोग कैसे करें?
डेटा क्या है?
डेटा कई चीजें हो सकती हैं। आर्टिफिशियल इंटेलिजेंस के साथ यह तथ्यों का संग्रह होना चाहिए:
प्रकार | उदाहरण |
---|---|
नंबर | कीमतें। खजूर। |
मापन | आकार। कद। वज़न। |
शब्दों | नाम और स्थान। |
टिप्पणियों | कारों की गिनती। |
विवरण | यह ठंडा है। |
इंटेलिजेंस को डेटा चाहिए
मानव बुद्धि को डेटा की आवश्यकता है:
एक रियल एस्टेट ब्रोकर को कीमतों का अनुमान लगाने के लिए बेचे गए घरों के बारे में डेटा की आवश्यकता होती है।
आर्टिफिशियल इंटेलिजेंस को चाहिए डेटा:
कीमतों का अनुमान लगाने के लिए एक कंप्यूटर प्रोग्राम को भी डेटा की आवश्यकता होती है।
आकड़ो का भंडारण किया जा रहा हैं
एकत्र करने के लिए सबसे आम डेटा संख्याएं और माप हैं।
अक्सर डेटा को मूल्यों के बीच संबंध का प्रतिनिधित्व करने वाले सरणियों में संग्रहीत किया जाता है।
इस तालिका में घर की कीमतें बनाम आकार शामिल हैं:
कीमत | 7 | 8 | 8 | 9 | 9 | 9 | 10 | 1 1 | 14 | 14 | 15 |
आकार | 50 | 60 | 70 | 80 | 90 | 100 | 110 | 120 | 130 | 140 | 150 |
मात्रात्मक बनाम गुणात्मक
मात्रात्मक डेटा संख्यात्मक हैं:
- 55 कारें
- 15 मीटर
- 35 बच्चे
गुणात्मक डेटा वर्णनात्मक हैं:
- यह ठंडा है
- यह लंबा है
- वह मज़ेदार था
जनगणना या नमूना
जनगणना तब होती है जब हम किसी समूह के प्रत्येक सदस्य के लिए डेटा एकत्र करते हैं।
एक नमूना तब होता है जब हम किसी समूह के कुछ सदस्यों के लिए डेटा एकत्र करते हैं।
यदि हम जानना चाहते हैं कि कितने अमेरिकी सिगरेट पीते हैं, तो हम अमेरिका में प्रत्येक व्यक्ति (एक जनगणना) से पूछ सकते हैं, या हम 10,000 लोगों (एक नमूना) से पूछ सकते हैं।
जनगणना सटीक है , लेकिन करना कठिन है। एक नमूना गलत है , लेकिन करना आसान है।
नमूना शर्तें
एक जनसंख्या व्यक्तियों (वस्तुओं) का समूह है जिससे हम जानकारी एकत्र करना चाहते हैं।
जनगणना जनसंख्या में प्रत्येक व्यक्ति के बारे में जानकारी है ।
एक नमूना जनसंख्या के एक हिस्से के बारे में जानकारी है (सभी का प्रतिनिधित्व करने के लिए)।
यादृच्छिक नमूने
जनसंख्या का प्रतिनिधित्व करने के लिए एक नमूना के लिए, इसे यादृच्छिक रूप से एकत्र किया जाना चाहिए।
एक यादृच्छिक नमूना , एक नमूना है जहां आबादी के प्रत्येक सदस्य को नमूने में उपस्थित होने का समान मौका मिलता है।
आंकड़ों की अशुद्धि
एक नमूनाकरण पूर्वाग्रह (त्रुटि) तब होता है जब नमूने इस तरह से एकत्र किए जाते हैं कि कुछ व्यक्तियों के नमूने में शामिल होने की संभावना कम (या अधिक) हो।