डेटा साइंस - पायथन डेटाफ़्रेम


पंडों के साथ एक डेटाफ़्रेम बनाएँ

डेटा फ़्रेम डेटा का एक संरचित प्रतिनिधित्व है।

आइए एक डेटा फ़्रेम को 3 कॉलम और 5 पंक्तियों के साथ काल्पनिक संख्याओं के साथ परिभाषित करें:

उदाहरण

import pandas as pd

d = {'col1': [1, 2, 3, 4, 7], 'col2': [4, 5, 6, 9, 5], 'col3': [7, 8, 12, 1, 11]}

df = pd.DataFrame(data=d)

print(df)

उदाहरण समझाया गया

  • पांडा पुस्तकालय को पीडी . के रूप में आयात करें
  • d . नामक चर में कॉलम और पंक्तियों के साथ डेटा को परिभाषित करें
  • फ़ंक्शन pd.DataFrame() का उपयोग करके डेटा फ़्रेम बनाएं
  • डेटा फ़्रेम में 3 कॉलम और 5 पंक्तियाँ होती हैं
  • प्रिंट () फ़ंक्शन के साथ डेटा फ़्रेम आउटपुट प्रिंट करें

हम पीडी लिखते हैं । डेटाफ़्रेम () के सामने पायथन को यह बताने के लिए कि हम पंडों के पुस्तकालय से डेटाफ़्रेम () फ़ंक्शन को सक्रिय करना चाहते हैं।

DataFrame में कैपिटल D और F से अवगत रहें!


आउटपुट की व्याख्या

यह आउटपुट है:

डेटाफ्रेम आउटपुट

हम देखते हैं कि "col1", "col2" और "col3" कॉलम के नाम हैं।

0-4 से लेकर लंबवत संख्याओं के बारे में भ्रमित न हों। वे हमें पंक्तियों की स्थिति के बारे में जानकारी बताते हैं।

पायथन में, पंक्तियों की संख्या शून्य से शुरू होती है।

अब, हम कॉलम और रो को गिनने के लिए पायथन का उपयोग कर सकते हैं।

स्तंभों की संख्या ज्ञात करने के लिए हम df.shape[1] का उपयोग कर सकते हैं:

उदाहरण

स्तंभों की संख्या गिनें:

count_column = df.shape[1]
print(count_column)

पंक्तियों की संख्या ज्ञात करने के लिए हम df.shape[0] का उपयोग कर सकते हैं:

उदाहरण

पंक्तियों की संख्या गिनें:

count_row = df.shape[0]
print(count_row)

हम केवल पंक्तियों और स्तंभों की गणना स्वयं क्यों नहीं कर सकते?

यदि हम कई स्तंभों और पंक्तियों के साथ बड़े डेटा सेट के साथ काम करते हैं, तो इसे स्वयं गिनना भ्रमित करने वाला होगा। आप इसे गलत तरीके से गिनने का जोखिम उठाते हैं। यदि हम पायथन में अंतर्निहित कार्यों का सही ढंग से उपयोग करते हैं, तो हम आश्वस्त करते हैं कि गणना सही है।