डेटा विज्ञान परिचय


डेटा साइंस कई विषयों का एक संयोजन है जो डेटा का विश्लेषण करने और इससे ज्ञान और अंतर्दृष्टि निकालने के लिए सांख्यिकी, डेटा विश्लेषण और मशीन लर्निंग का उपयोग करता है।


डेटा साइंस क्या है?

डेटा साइंस डेटा एकत्र करने, विश्लेषण और निर्णय लेने के बारे में है।

डेटा साइंस विश्लेषण के माध्यम से डेटा में पैटर्न खोजने और भविष्य की भविष्यवाणी करने के बारे में है।

डेटा साइंस का उपयोग करके, कंपनियां यह करने में सक्षम हैं:

  • बेहतर निर्णय (क्या हमें ए या बी चुनना चाहिए)
  • भविष्य कहनेवाला विश्लेषण (आगे क्या होगा?)
  • पैटर्न खोजें (पैटर्न खोजें, या शायद डेटा में छिपी जानकारी)

डेटा साइंस की आवश्यकता कहाँ है?

डेटा साइंस का उपयोग आज दुनिया के कई उद्योगों में किया जाता है, जैसे बैंकिंग, कंसल्टेंसी, हेल्थकेयर और मैन्युफैक्चरिंग।

जहां डेटा विज्ञान की आवश्यकता है उसके उदाहरण:

  • मार्ग नियोजन के लिए: जहाज के लिए सर्वोत्तम मार्ग खोजने के लिए
  • उड़ान/जहाज/ट्रेन आदि के लिए देरी की भविष्यवाणी करना (भविष्यवाणी विश्लेषण के माध्यम से)
  • प्रचार ऑफ़र बनाने के लिए
  • माल पहुंचाने के लिए सबसे उपयुक्त समय खोजने के लिए
  • किसी कंपनी के लिए अगले वर्षों के राजस्व का पूर्वानुमान लगाने के लिए
  • प्रशिक्षण के स्वास्थ्य लाभ का विश्लेषण करने के लिए
  • भविष्यवाणी करने के लिए कि चुनाव कौन जीतेगा

डेटा साइंस को व्यवसाय के लगभग हर हिस्से में लागू किया जा सकता है जहाँ डेटा उपलब्ध है। उदाहरण हैं:

  • उपभोक्ता वस्तुओं
  • शेयर बाजार
  • उद्योग
  • राजनीति
  • लॉजिस्टिक कंपनियां
  • ई-कॉमर्स

डेटा साइंटिस्ट कैसे काम करता है?

एक डेटा वैज्ञानिक को कई पृष्ठभूमियों में विशेषज्ञता की आवश्यकता होती है:

  • यंत्र अधिगम
  • आंकड़े
  • प्रोग्रामिंग (पायथन या आर)
  • गणित
  • डेटाबेस

डेटा साइंटिस्ट को डेटा के भीतर पैटर्न ढूंढना चाहिए। इससे पहले कि वह पैटर्न ढूंढ सके, उसे डेटा को एक मानक प्रारूप में व्यवस्थित करना होगा।

यहां बताया गया है कि डेटा साइंटिस्ट कैसे काम करता है:

  1. सही प्रश्न पूछें - व्यवसाय की समस्या को समझने के लिए।
  2. डेटा का अन्वेषण और संग्रह करें - डेटाबेस, वेब लॉग, ग्राहक प्रतिक्रिया आदि से।
  3. डेटा निकालें - डेटा को एक मानकीकृत प्रारूप में बदलें।
  4. डेटा साफ़ करें - डेटा से गलत मान निकालें।
  5. लापता मूल्यों को खोजें और बदलें - लापता मूल्यों की जांच करें और उन्हें एक उपयुक्त मूल्य (जैसे औसत मूल्य) के साथ बदलें।
  6. डेटा को सामान्य करें - एक व्यावहारिक श्रेणी में मानों को स्केल करें (उदाहरण के लिए 140 सेमी 1,8 मीटर से छोटा है। हालांकि, 140 की संख्या 1,8 से बड़ी है। - इसलिए स्केलिंग महत्वपूर्ण है)।
  7. डेटा का विश्लेषण करें, पैटर्न खोजें और भविष्य की भविष्यवाणी करें
  8. परिणाम का प्रतिनिधित्व करें - परिणाम को उपयोगी अंतर्दृष्टि के साथ प्रस्तुत करें जिस तरह से "कंपनी" समझ सकती है।

कहां से शुरू करें?

इस ट्यूटोरियल में, हम यह प्रस्तुत करके शुरू करेंगे कि डेटा क्या है और डेटा का विश्लेषण कैसे किया जा सकता है।

आप भविष्यवाणी करने के लिए सांख्यिकी और गणितीय कार्यों का उपयोग करना सीखेंगे।