تحليل ملفات CSV المفصولة بفاصلة منقوطة باستخدام Pandas
عند التعامل مع ملفات القيم المفصولة بفاصلة (CSV)، من الضروري التعامل معها بشكل صحيح فواصل لضمان تحليل دقيق للبيانات. يوفر Pandas حلاً مباشرًا لقراءة ملفات CSV باستخدام فواصل غير قياسية، مثل الفواصل المنقوطة.
ضع في اعتبارك هذا السيناريو: لديك ملف .csv بتنسيق مشابه لما يلي:
a1;b1;c1;d1;e1;... a2;b2;c2;d2;e2;...
لاستيراد هذا الملف إلى Pandas DataFrame، يمكنك استخدام وظيفة read_csv(). ومع ذلك، افتراضيًا، تفترض الباندا أن الفاصل عبارة عن فاصلة. لتحديد فاصل منقوطين، استخدم المعلمة sep كما يلي:
import pandas as pd
csv_path = "C:...."
data = pd.read_csv(csv_path, sep=';')
إذا نسيت تحديد المعلمة sep، فإن السلوك الافتراضي لـ pandas هو التعامل مع جميع البيانات كعمود واحد، مما يؤدي إلى نتائج خاطئة عند الطباعة the DataFrame.
سبب هذا السلوك الافتراضي هو أن الباندا تفترض أن الفواصل هي الفاصل الأكثر شيوعًا. من خلال توفير المعلمة sep، فإنك تقوم بإرشاد الباندا بشكل صريح لاستخدام الفواصل المنقوطة كفواصل، مما يضمن التحليل الصحيح لبياناتك.
باختصار، عند التعامل مع ملفات CSV مفصولة بفواصل نقطية في الباندا، تذكر دائمًا تحديد سبتمبر =';' في الدالة read_csv() للحصول على تحليل دقيق للبيانات.
تنصل: جميع الموارد المقدمة هي جزئيًا من الإنترنت. إذا كان هناك أي انتهاك لحقوق الطبع والنشر الخاصة بك أو الحقوق والمصالح الأخرى، فيرجى توضيح الأسباب التفصيلية وتقديم دليل على حقوق الطبع والنشر أو الحقوق والمصالح ثم إرسالها إلى البريد الإلكتروني: [email protected]. سوف نتعامل مع الأمر لك في أقرب وقت ممكن.
Copyright© 2022 湘ICP备2022001581号-3