डेटा साइंस - पायथन डेटाफ़्रेम
पंडों के साथ एक डेटाफ़्रेम बनाएँ
डेटा फ़्रेम डेटा का एक संरचित प्रतिनिधित्व है।
आइए एक डेटा फ़्रेम को 3 कॉलम और 5 पंक्तियों के साथ काल्पनिक संख्याओं के साथ परिभाषित करें:
उदाहरण
import pandas as pd
d = {'col1': [1, 2, 3, 4, 7], 'col2': [4, 5, 6, 9,
5], 'col3': [7, 8, 12, 1, 11]}
df = pd.DataFrame(data=d)
print(df)
उदाहरण समझाया गया
- पांडा पुस्तकालय को पीडी . के रूप में आयात करें
- d . नामक चर में कॉलम और पंक्तियों के साथ डेटा को परिभाषित करें
- फ़ंक्शन pd.DataFrame() का उपयोग करके डेटा फ़्रेम बनाएं
- डेटा फ़्रेम में 3 कॉलम और 5 पंक्तियाँ होती हैं
- प्रिंट () फ़ंक्शन के साथ डेटा फ़्रेम आउटपुट प्रिंट करें
हम पीडी लिखते हैं । डेटाफ़्रेम () के सामने पायथन को यह बताने के लिए कि हम पंडों के पुस्तकालय से डेटाफ़्रेम () फ़ंक्शन को सक्रिय करना चाहते हैं।
DataFrame में कैपिटल D और F से अवगत रहें!
आउटपुट की व्याख्या
यह आउटपुट है:
हम देखते हैं कि "col1", "col2" और "col3" कॉलम के नाम हैं।
0-4 से लेकर लंबवत संख्याओं के बारे में भ्रमित न हों। वे हमें पंक्तियों की स्थिति के बारे में जानकारी बताते हैं।
पायथन में, पंक्तियों की संख्या शून्य से शुरू होती है।
अब, हम कॉलम और रो को गिनने के लिए पायथन का उपयोग कर सकते हैं।
स्तंभों की संख्या ज्ञात करने के लिए हम df.shape[1] का उपयोग कर सकते हैं:
उदाहरण
स्तंभों की संख्या गिनें:
count_column = df.shape[1]
print(count_column)
पंक्तियों की संख्या ज्ञात करने के लिए हम df.shape[0] का उपयोग कर सकते हैं:
उदाहरण
पंक्तियों की संख्या गिनें:
count_row = df.shape[0]
print(count_row)
हम केवल पंक्तियों और स्तंभों की गणना स्वयं क्यों नहीं कर सकते?
यदि हम कई स्तंभों और पंक्तियों के साथ बड़े डेटा सेट के साथ काम करते हैं, तो इसे स्वयं गिनना भ्रमित करने वाला होगा। आप इसे गलत तरीके से गिनने का जोखिम उठाते हैं। यदि हम पायथन में अंतर्निहित कार्यों का सही ढंग से उपयोग करते हैं, तो हम आश्वस्त करते हैं कि गणना सही है।