1. Learn
  2. /
  3. कोर्स
  4. /
  5. Python में डेटा आयात का परिचय

Connected

अभ्यास

DataFrames के रूप में फ्लैट फाइल इम्पोर्ट करने के लिए pandas का उपयोग (2)

पिछले अभ्यास में, आपने एक फ्लैट फाइल को pandas DataFrame में इम्पोर्ट किया था. बोनस यह है कि उसी से संबंधित numpy array को .to_numpy() मेथड से सीधे निकाला जा सकता है. अब आप यह MNIST डेटासेट पर आज़माएँगे, जो digits.csv के रूप में उपलब्ध है.

pd.read_csv() कई आर्गुमेंट लेता है जो इस अभ्यास में आपके काम आएँगे:

  • nrows आपको यह निर्धारित करने देता है कि फ़ाइल से कितनी पंक्तियाँ पढ़नी हैं. उदाहरण के लिए, nrows=10 सिर्फ पहली 10 पंक्तियाँ इम्पोर्ट करेगा.
  • header उस पंक्ति संख्या को स्वीकार करता है जिसका उपयोग कॉलम लेबल के रूप में किया जाएगा और जहाँ से डेटा शुरू होता है. अगर फ़ाइल में हेडर पंक्ति नहीं है, तो आप header=None सेट कर सकते हैं, और pandas स्वतः 0 से शुरू होने वाले इन्टीजर कॉलम लेबल असाइन कर देगा (जैसे, 0, 1, 2, …).

निर्देश

100 XP
  • फ़ंक्शन pd.read_csv() का उपयोग करके फ़ाइल की पहली 5 पंक्तियाँ एक DataFrame में इम्पोर्ट करें और परिणाम को data में असाइन करें. आपको nrows और header आर्गुमेंट का उपयोग करना होगा. ध्यान दें कि इस फ़ाइल में कोई हेडर पंक्ति नहीं है.
  • data में बने DataFrame से एक numpy array बनाएँ और उसे data_array में असाइन करें.
  • print(type(data_array)) चलाकर data_array के datatype को प्रिंट करें.