डेटा विज्ञान कार्य


यह अध्याय डेटा विज्ञान के साथ काम करते समय आमतौर पर उपयोग किए जाने वाले तीन कार्यों को दिखाता है: अधिकतम (), न्यूनतम (), और माध्य ()।


स्पोर्ट्स वॉच डेटा सेट

अवधि औसत_पल्स मैक्स_पल्स कैलोरी_बर्नेज घंटे_कार्य घंटे_नींद
30 80 120 240 10 7
30 85 120 250 10 7
45 90 130 260 8 7
45 95 130 270 8 7
45 100 140 280 0 7
60 105 140 290 7 8
60 110 145 300 7 8
60 115 145 310 8 8
75 120 150 320 0 8
75 125 150 330 8 8

ऊपर दिए गए डेटा में 6 चर होते हैं, जिनमें से प्रत्येक में 10 अवलोकन होते हैं:

  • अवधि - प्रशिक्षण सत्र मिनटों में कितने समय तक चला?
  • औसत_पल्स - प्रशिक्षण सत्र की औसत नब्ज क्या थी? इसे बीट्स प्रति मिनट द्वारा मापा जाता है
  • Max_Pulse - प्रशिक्षण सत्र की अधिकतम पल्स क्या थी?
  • कैलोरी_बर्नेज - प्रशिक्षण सत्र में कितनी कैलोरी बर्न हुई?
  • घंटे_काम - प्रशिक्षण सत्र से पहले हमने अपने काम पर कितने घंटे काम किया?
  • घंटे_नींद - प्रशिक्षण सत्र से एक रात पहले हमने कितना सोया?

हम स्ट्रिंग्स को अलग करने के लिए अंडरस्कोर (_) का उपयोग करते हैं क्योंकि पायथन स्पेस को विभाजक के रूप में नहीं पढ़ सकता है।



अधिकतम () फ़ंक्शन

पायथन max()फ़ंक्शन का उपयोग किसी सरणी में उच्चतम मान खोजने के लिए किया जाता है।

उदाहरण

Average_pulse_max = max(80, 85, 90, 95, 100, 105, 110, 115, 120, 125)

print (Average_pulse_max)

न्यूनतम () फ़ंक्शन

पायथन min()फ़ंक्शन का उपयोग किसी सरणी में सबसे कम मान खोजने के लिए किया जाता है।

उदाहरण

Average_pulse_min = min(80, 85, 90, 95, 100, 105, 110, 115, 120, 125)

print (Average_pulse_min)

माध्य () फ़ंक्शन

NumPy mean()फ़ंक्शन का उपयोग किसी सरणी के औसत मान को खोजने के लिए किया जाता है।

उदाहरण

import numpy as np

Calorie_burnage = [240, 250, 260, 270, 280, 290, 300, 310, 320, 330]

Average_calorie_burnage = np.mean(Calorie_burnage)

print(Average_calorie_burnage)

हम एनपी लिखते हैं । माध्य के सामने पायथन को यह बताने के लिए कि हम Numpy लाइब्रेरी से माध्य फ़ंक्शन को सक्रिय करना चाहते हैं।