डेटा साइंस - डेटा क्या है?


डेटा क्या है?

डेटा सूचनाओं का एक संग्रह है।

डेटा साइंस का एक उद्देश्य डेटा की संरचना करना, इसे व्याख्यात्मक और काम करने में आसान बनाना है।

डेटा को दो समूहों में वर्गीकृत किया जा सकता है:

  • संरचित डेटा
  • असंरचित डेटा

असंरचित डेटा

असंरचित डेटा व्यवस्थित नहीं है। हमें विश्लेषण उद्देश्यों के लिए डेटा को व्यवस्थित करना चाहिए।

असंरचित डेटा

असंरचित डेटा


संरचित डेटा

संरचित डेटा व्यवस्थित और काम करने में आसान होता है।

संरचित डेटा


डेटा की संरचना कैसे करें?

हम डेटा की संरचना या प्रस्तुत करने के लिए एक सरणी या डेटाबेस तालिका का उपयोग कर सकते हैं।

एक सरणी का उदाहरण:

[80, 85, 90, 95, 100, 105, 110, 115, 120, 125]

निम्न उदाहरण दिखाता है कि पायथन में एक सरणी कैसे बनाई जाती है:

उदाहरण

Array = [80, 85, 90, 95, 100, 105, 110, 115, 120, 125]
print(Array)

डेटा साइंस में बहुत बड़े डेटा सेट के साथ काम करना आम बात है।

इस ट्यूटोरियल में हम डेटा साइंस की अवधारणाओं को समझने में यथासंभव आसान बनाने का प्रयास करेंगे। इसलिए हम एक छोटे डेटा सेट के साथ काम करेंगे जिसकी व्याख्या करना आसान है।