उदाहरण 2 डेटा
उदाहरण 2 उदाहरण 1 के समान स्रोत कोड का उपयोग करता है।
लेकिन, क्योंकि किसी अन्य डेटासेट का उपयोग किया जाता है, कोड को अन्य डेटा एकत्र करना चाहिए।
आंकड़ा संग्रहण
उदाहरण 2 में प्रयुक्त डेटा, घरेलू वस्तुओं की एक सूची है:
{
"Avg. Area Income": 79545.45857,
"Avg. Area House Age": 5.682861322,
"Avg. AreaNumberofRooms": 7.009188143,
"Avg. Area Number of Bedrooms": 4.09,
"Area Population": 23086.8005,
"Price": 1059033.558,
},
{
"Avg. Area Income": 79248.64245,
"Avg. Area House Age": 6.002899808,
"Avg. AreaNumberofRooms": 6.730821019,
"Avg. Area Number of Bedrooms": 3.09,
"Area Population": 40173.07217,
"Price": 1505890.915,
},
डेटासेट एक JSON फ़ाइल है जिसे यहां संग्रहीत किया जाता है:
https://github.com/meetnandu05/ml1/blob/master/house.jsonसफाई डेटा
मशीन लर्निंग की तैयारी करते समय, यह हमेशा महत्वपूर्ण होता है:
- वह डेटा हटाएं जिसकी आपको आवश्यकता नहीं है
- त्रुटियों से डेटा साफ़ करें
डेटा हटाएं
अनावश्यक डेटा को हटाने का एक स्मार्ट तरीका, यह केवल आपको आवश्यक डेटा निकालने के लिए है ।
यह आपके डेटा को मैप फ़ंक्शन के साथ पुनरावृति (लूपिंग ओवर) करके किया जा सकता है ।
नीचे दिया गया फ़ंक्शन ऑब्जेक्ट लेता है और ऑब्जेक्ट की हॉर्सपावर और Miles_per_Gallon गुणों से केवल x और y लौटाता है:
function extractData(obj) {
return {x:obj.Horsepower, y:obj.Miles_per_Gallon};
}
त्रुटियां हटाएं
अधिकांश डेटासेट में कुछ प्रकार की त्रुटियां होती हैं।
त्रुटियों को दूर करने का एक स्मार्ट तरीका त्रुटियों को फ़िल्टर करने के लिए फ़िल्टर फ़ंक्शन का उपयोग करना है।
यदि गुणों में से (x या y) में शून्य मान है, तो नीचे दिया गया कोड गलत है:
function removeErrors(obj) {
return obj.x != null && obj.y != null;
}
डेटा लाया जा रहा है
जब आपके पास अपना नक्शा और फ़िल्टर फ़ंक्शन तैयार हो, तो आप डेटा लाने के लिए एक फ़ंक्शन लिख सकते हैं।
async function runTF() {
const jsonData = await fetch("cardata.json");
let values = await jsonData.json();
values = values.map(extractData).filter(removeErrors);
}
डेटा प्लॉट करना
यहां कुछ कोड दिया गया है जिसका उपयोग आप डेटा को प्लॉट करने के लिए कर सकते हैं:
function tfPlot(values, surface) {
tfvis.render.scatterplot(surface,
{values:values, series:['Original','Predicted']},
{xLabel:'Rooms', yLabel:'Price',});
}