पांडा - डेटाफ़्रेम का विश्लेषण
डेटा देखना
डेटाफ़्रेम का त्वरित अवलोकन प्राप्त करने के लिए सबसे अधिक उपयोग की जाने वाली विधि में से एक head()
विधि है।
विधि शीर्षलेख और पंक्तियों की head()
एक निर्दिष्ट संख्या लौटाती है, जो ऊपर से शुरू होती है।
उदाहरण
DataFrame की पहली 10 पंक्तियों को प्रिंट करके एक त्वरित अवलोकन प्राप्त करें:
import pandas as pd
df = pd.read_csv('data.csv')
print(df.head(10))
हमारे उदाहरणों में हम 'data.csv' नामक एक CSV फ़ाइल का उपयोग करेंगे।
data.csv डाउनलोड करें , या अपने ब्राउज़र में data.csv खोलें।
नोट: यदि पंक्तियों की संख्या निर्दिष्ट नहीं है, तो head()
विधि शीर्ष 5 पंक्तियों को वापस कर देगी।
उदाहरण
DataFrame की पहली 5 पंक्तियों को प्रिंट करें:
import pandas as pd
df = pd.read_csv('data.csv')
print(df.head())
DataFrame की अंतिम पंक्तियों को देखने का एक tail()
तरीका
भी है।
विधि शीर्षलेख और पंक्तियों की tail()
एक निर्दिष्ट संख्या लौटाती है, जो नीचे से शुरू होती है।
उदाहरण
DataFrame की अंतिम 5 पंक्तियाँ प्रिंट करें:
print(df.tail())
प्रमाणन हासिल करें!
$10 नामांकन
डेटा के बारे में जानकारी
DataFrames ऑब्जेक्ट में एक विधि होती है जिसे कहा जाता है info()
, जो आपको डेटा सेट के बारे में अधिक जानकारी देती है।
उदाहरण
डेटा के बारे में जानकारी प्रिंट करें:
print(df.info())
परिणाम
<class 'pandas.core.frame.DataFrame'> RangeIndex: 169 entries, 0 to 168 Data columns (total 4 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 Duration 169 non-null int64 1 Pulse 169 non-null int64 2 Maxpulse 169 non-null int64 3 Calories 164 non-null float64 dtypes: float64(1), int64(3) memory usage: 5.4 KB None
परिणाम समझाया
परिणाम हमें बताता है कि 169 पंक्तियाँ और 4 स्तंभ हैं:
RangeIndex: 169 entries, 0 to 168 Data columns (total 4 columns):
और डेटा प्रकार के साथ प्रत्येक कॉलम का नाम:
# Column Non-Null Count Dtype --- ------ -------------- ----- 0 Duration 169 non-null int64 1 Pulse 169 non-null int64 2 Maxpulse 169 non-null int64 3 Calories 164 non-null float64
शून्य मान
विधि हमें यह info()
भी बताती है कि प्रत्येक कॉलम में कितने गैर-शून्य मान मौजूद हैं, और हमारे डेटा सेट में ऐसा लगता है कि "कैलोरी" कॉलम में 169 में से 164 गैर-शून्य मान हैं।
जिसका अर्थ है कि "कैलोरी" कॉलम में, किसी भी कारण से, बिना किसी मूल्य के 5 पंक्तियाँ हैं।
डेटा का विश्लेषण करते समय खाली मान या शून्य मान खराब हो सकते हैं, और आपको खाली मानों वाली पंक्तियों को हटाने पर विचार करना चाहिए। यह सफाई डेटा की ओर एक कदम है , और आप इसके बारे में अगले अध्यायों में जानेंगे।