पांडा - डेटाफ़्रेम का विश्लेषण


डेटा देखना

डेटाफ़्रेम का त्वरित अवलोकन प्राप्त करने के लिए सबसे अधिक उपयोग की जाने वाली विधि में से एक head()विधि है।

विधि शीर्षलेख और पंक्तियों की head()एक निर्दिष्ट संख्या लौटाती है, जो ऊपर से शुरू होती है।

उदाहरण

DataFrame की पहली 10 पंक्तियों को प्रिंट करके एक त्वरित अवलोकन प्राप्त करें:

import pandas as pd

df = pd.read_csv('data.csv')

print(df.head(10))

हमारे उदाहरणों में हम 'data.csv' नामक एक CSV फ़ाइल का उपयोग करेंगे।

data.csv डाउनलोड करें , या अपने ब्राउज़र में data.csv खोलें।

नोट: यदि पंक्तियों की संख्या निर्दिष्ट नहीं है, तो head()विधि शीर्ष 5 पंक्तियों को वापस कर देगी।

उदाहरण

DataFrame की पहली 5 पंक्तियों को प्रिंट करें:

import pandas as pd

df = pd.read_csv('data.csv')

print(df.head())

DataFrame की अंतिम पंक्तियों को देखने का एक tail()तरीका भी है।

विधि शीर्षलेख और पंक्तियों की tail()एक निर्दिष्ट संख्या लौटाती है, जो नीचे से शुरू होती है।

उदाहरण

DataFrame की अंतिम 5 पंक्तियाँ प्रिंट करें:

print(df.tail()) 

w3schools CERTIFIED . 2021

प्रमाणन हासिल करें!

पांडा मॉड्यूल को पूरा करें, अभ्यास करें, परीक्षा दें, और आप w3schools प्रमाणित हो जाएंगे!

$10 नामांकन

डेटा के बारे में जानकारी

DataFrames ऑब्जेक्ट में एक विधि होती है जिसे कहा जाता है info(), जो आपको डेटा सेट के बारे में अधिक जानकारी देती है।

उदाहरण

डेटा के बारे में जानकारी प्रिंट करें:

print(df.info()) 

परिणाम

  <class 'pandas.core.frame.DataFrame'>
  RangeIndex: 169 entries, 0 to 168
  Data columns (total 4 columns):
   #   Column    Non-Null Count  Dtype  
  ---  ------    --------------  -----  
   0   Duration  169 non-null    int64  
   1   Pulse     169 non-null    int64  
   2   Maxpulse  169 non-null    int64  
   3   Calories  164 non-null    float64
  dtypes: float64(1), int64(3)
  memory usage: 5.4 KB
  None
    

परिणाम समझाया

परिणाम हमें बताता है कि 169 पंक्तियाँ और 4 स्तंभ हैं:

  RangeIndex: 169 entries, 0 to 168
  Data columns (total 4 columns):

और डेटा प्रकार के साथ प्रत्येक कॉलम का नाम:

   #   Column    Non-Null Count  Dtype  
  ---  ------    --------------  -----  
   0   Duration  169 non-null    int64  
   1   Pulse     169 non-null    int64  
   2   Maxpulse  169 non-null    int64  
   3   Calories  164 non-null    float64

शून्य मान

विधि हमें यह info()भी बताती है कि प्रत्येक कॉलम में कितने गैर-शून्य मान मौजूद हैं, और हमारे डेटा सेट में ऐसा लगता है कि "कैलोरी" कॉलम में 169 में से 164 गैर-शून्य मान हैं।

जिसका अर्थ है कि "कैलोरी" कॉलम में, किसी भी कारण से, बिना किसी मूल्य के 5 पंक्तियाँ हैं।

डेटा का विश्लेषण करते समय खाली मान या शून्य मान खराब हो सकते हैं, और आपको खाली मानों वाली पंक्तियों को हटाने पर विचार करना चाहिए। यह सफाई डेटा की ओर एक कदम है , और आप इसके बारे में अगले अध्यायों में जानेंगे।