उदाहरण 1 डेटा
TensorFlow डेटा संग्रह
उदाहरण 1 में प्रयुक्त डेटा इस तरह कार वस्तुओं की एक सूची है:
{
"Name": "chevrolet chevelle malibu",
"Miles_per_Gallon": 18,
"Cylinders": 8,
"Displacement": 307,
"Horsepower": 130,
"Weight_in_lbs": 3504,
"Acceleration": 12,
"Year": "1970-01-01",
"Origin": "USA"
},
{
"Name": "buick skylark 320",
"Miles_per_Gallon": 15,
"Cylinders": 8,
"Displacement": 350,
"Horsepower": 165,
"Weight_in_lbs": 3693,
"Acceleration": 11.5,
"Year": "1970-01-01",
"Origin": "USA"
},
डेटासेट एक JSON फ़ाइल है जिसे यहां संग्रहीत किया जाता है:
https://storage.googleapis.com/tfjs-tutorials/carsData.json
सफाई डेटा
मशीन लर्निंग की तैयारी करते समय, यह हमेशा महत्वपूर्ण होता है:
- वह डेटा हटाएं जिसकी आपको आवश्यकता नहीं है
- त्रुटियों से डेटा साफ़ करें
डेटा हटाएं
अनावश्यक डेटा को हटाने का एक स्मार्ट तरीका, यह केवल आपको आवश्यक डेटा निकालने के लिए है ।
यह आपके डेटा को मैप फ़ंक्शन के साथ पुनरावृति (लूपिंग ओवर) करके किया जा सकता है ।
नीचे दिया गया फ़ंक्शन ऑब्जेक्ट लेता है और ऑब्जेक्ट की हॉर्सपावर और Miles_per_Gallon गुणों से केवल x और y लौटाता है:
function extractData(obj) {
return {x:obj.Horsepower, y:obj.Miles_per_Gallon};
}
त्रुटियां हटाएं
अधिकांश डेटासेट में कुछ प्रकार की त्रुटियां होती हैं।
त्रुटियों को दूर करने का एक स्मार्ट तरीका त्रुटियों को फ़िल्टर करने के लिए फ़िल्टर फ़ंक्शन का उपयोग करना है।
यदि गुणों में से (x या y) में शून्य मान है, तो नीचे दिया गया कोड गलत है:
function removeErrors(obj) {
return obj.x != null && obj.y != null;
}
डेटा लाया जा रहा है
जब आपके पास अपना नक्शा और फ़िल्टर फ़ंक्शन तैयार हो, तो आप डेटा लाने के लिए एक फ़ंक्शन लिख सकते हैं।
async function runTF() {
const jsonData = await fetch("cardata.json");
let values = await jsonData.json();
values = values.map(extractData).filter(removeErrors);
}
डेटा प्लॉट करना
यहां कुछ कोड दिया गया है जिसका उपयोग आप डेटा को प्लॉट करने के लिए कर सकते हैं:
function tfPlot(values, surface) {
tfvis.render.scatterplot(surface,
{values:values, series:['Original','Predicted']},
{xLabel:'Horsepower', yLabel:'MPG'});
}