डेटा विज्ञान - सांख्यिकी का परिचय


सांख्यिकी का परिचय

सांख्यिकी आंकड़ों के विश्लेषण का विज्ञान है।

जब हमने भविष्यवाणी के लिए एक मॉडल बनाया है, तो हमें भविष्यवाणी की विश्वसनीयता का आकलन करना चाहिए।

आखिर भविष्यवाणी की क्या कीमत है, अगर हम उस पर भरोसा नहीं कर सकते?


वर्णनात्मक आँकड़े

हम पहले कुछ बुनियादी वर्णनात्मक आँकड़ों को शामिल करेंगे।

वर्णनात्मक आँकड़े डेटा सेट की महत्वपूर्ण विशेषताओं को सारांशित करते हैं जैसे:

  • गिनती
  • योग
  • मानक विचलन
  • प्रतिशतता
  • औसत
  • आदि..

डेटा से परिचित होने के लिए यह एक अच्छा प्रारंभिक बिंदु है।

हम describe()डेटा को सारांशित करने के लिए पायथन में फ़ंक्शन का उपयोग कर सकते हैं:

उदाहरण

print (full_health_data.describe())

आउटपुट:

स्टेट वर्णन

क्या आपको यहाँ कुछ दिलचस्प दिखाई दे रहा है?