डेटा विज्ञान परिचय
डेटा साइंस कई विषयों का एक संयोजन है जो डेटा का विश्लेषण करने और इससे ज्ञान और अंतर्दृष्टि निकालने के लिए सांख्यिकी, डेटा विश्लेषण और मशीन लर्निंग का उपयोग करता है।
डेटा साइंस क्या है?
डेटा साइंस डेटा एकत्र करने, विश्लेषण और निर्णय लेने के बारे में है।
डेटा साइंस विश्लेषण के माध्यम से डेटा में पैटर्न खोजने और भविष्य की भविष्यवाणी करने के बारे में है।
डेटा साइंस का उपयोग करके, कंपनियां यह करने में सक्षम हैं:
- बेहतर निर्णय (क्या हमें ए या बी चुनना चाहिए)
- भविष्य कहनेवाला विश्लेषण (आगे क्या होगा?)
- पैटर्न खोजें (पैटर्न खोजें, या शायद डेटा में छिपी जानकारी)
डेटा साइंस की आवश्यकता कहाँ है?
डेटा साइंस का उपयोग आज दुनिया के कई उद्योगों में किया जाता है, जैसे बैंकिंग, कंसल्टेंसी, हेल्थकेयर और मैन्युफैक्चरिंग।
जहां डेटा विज्ञान की आवश्यकता है उसके उदाहरण:
- मार्ग नियोजन के लिए: जहाज के लिए सर्वोत्तम मार्ग खोजने के लिए
- उड़ान/जहाज/ट्रेन आदि के लिए देरी की भविष्यवाणी करना (भविष्यवाणी विश्लेषण के माध्यम से)
- प्रचार ऑफ़र बनाने के लिए
- माल पहुंचाने के लिए सबसे उपयुक्त समय खोजने के लिए
- किसी कंपनी के लिए अगले वर्षों के राजस्व का पूर्वानुमान लगाने के लिए
- प्रशिक्षण के स्वास्थ्य लाभ का विश्लेषण करने के लिए
- भविष्यवाणी करने के लिए कि चुनाव कौन जीतेगा
डेटा साइंस को व्यवसाय के लगभग हर हिस्से में लागू किया जा सकता है जहाँ डेटा उपलब्ध है। उदाहरण हैं:
- उपभोक्ता वस्तुओं
- शेयर बाजार
- उद्योग
- राजनीति
- लॉजिस्टिक कंपनियां
- ई-कॉमर्स
डेटा साइंटिस्ट कैसे काम करता है?
एक डेटा वैज्ञानिक को कई पृष्ठभूमियों में विशेषज्ञता की आवश्यकता होती है:
- यंत्र अधिगम
- आंकड़े
- प्रोग्रामिंग (पायथन या आर)
- गणित
- डेटाबेस
डेटा साइंटिस्ट को डेटा के भीतर पैटर्न ढूंढना चाहिए। इससे पहले कि वह पैटर्न ढूंढ सके, उसे डेटा को एक मानक प्रारूप में व्यवस्थित करना होगा।
यहां बताया गया है कि डेटा साइंटिस्ट कैसे काम करता है:
- सही प्रश्न पूछें - व्यवसाय की समस्या को समझने के लिए।
- डेटा का अन्वेषण और संग्रह करें - डेटाबेस, वेब लॉग, ग्राहक प्रतिक्रिया आदि से।
- डेटा निकालें - डेटा को एक मानकीकृत प्रारूप में बदलें।
- डेटा साफ़ करें - डेटा से गलत मान निकालें।
- लापता मूल्यों को खोजें और बदलें - लापता मूल्यों की जांच करें और उन्हें एक उपयुक्त मूल्य (जैसे औसत मूल्य) के साथ बदलें।
- डेटा को सामान्य करें - एक व्यावहारिक श्रेणी में मानों को स्केल करें (उदाहरण के लिए 140 सेमी 1,8 मीटर से छोटा है। हालांकि, 140 की संख्या 1,8 से बड़ी है। - इसलिए स्केलिंग महत्वपूर्ण है)।
- डेटा का विश्लेषण करें, पैटर्न खोजें और भविष्य की भविष्यवाणी करें ।
- परिणाम का प्रतिनिधित्व करें - परिणाम को उपयोगी अंतर्दृष्टि के साथ प्रस्तुत करें जिस तरह से "कंपनी" समझ सकती है।
कहां से शुरू करें?
इस ट्यूटोरियल में, हम यह प्रस्तुत करके शुरू करेंगे कि डेटा क्या है और डेटा का विश्लेषण कैसे किया जा सकता है।
आप भविष्यवाणी करने के लिए सांख्यिकी और गणितीय कार्यों का उपयोग करना सीखेंगे।