الجمع بين إطارات بيانات Pandas: الانضمام إلى عمود مشترك
تعتبر أداة النجار عملية أساسية لدمج إطارات البيانات بناءً على السمات المشتركة. يفحص هذا السؤال مسألة الجمع بين إطاري بيانات الباندا: Restaurant_ids_dataframe وrestaurant_review_frame.
يحاول المستخدم استخدام أسلوب DataFrame.join() لإجراء صلة يسرى باستخدام العمود Business_id. ومع ذلك، يحدث خطأ بسبب تداخل الأعمدة (business_id، والنجوم، والنوع). لحل هذه المشكلة، يمكننا استخدام وظيفة الدمج بدلاً من ذلك:
import pandas as pd
pd.merge(restaurant_ids_dataframe, restaurant_review_frame, on='business_id', how='outer')
تحدد المعلمة on اسم الحقل المستخدم للانضمام، بينما تحدد المعلمة how نوع الانضمام (خارجي، داخلي، يساراً أو يميناً). في هذه الحالة، يتم تحديد الخارجي لاتحاد المفاتيح من كلا إطاري البيانات.
لاحظ أن كلا إطاري البيانات يحتويان على عمود يسمى النجوم. بشكل افتراضي، تقوم عملية الدمج بإلحاق لاحقات بأسماء الأعمدة (star_x وstar_y). لتخصيص هذه اللواحق، يمكننا استخدام وسيطة الكلمة الأساسية لللاحقات:
pd.merge(restaurant_ids_dataframe, restaurant_review_frame, on='business_id', how='outer', suffixes=('_restaurant_id', '_restaurant_review'))
مع هذا التعديل، ستتم إعادة تسمية أعمدة النجوم إلى star_restaurant_id وstar_restaurant_review. من خلال الاستفادة من وظيفة الدمج وتكوين نوع الصلة ولاحقات الأعمدة بشكل مناسب، يمكننا دمج إطاري البيانات بنجاح بناءً على عمود Business_id المشترك الخاص بهما.
تنصل: جميع الموارد المقدمة هي جزئيًا من الإنترنت. إذا كان هناك أي انتهاك لحقوق الطبع والنشر الخاصة بك أو الحقوق والمصالح الأخرى، فيرجى توضيح الأسباب التفصيلية وتقديم دليل على حقوق الطبع والنشر أو الحقوق والمصالح ثم إرسالها إلى البريد الإلكتروني: [email protected]. سوف نتعامل مع الأمر لك في أقرب وقت ممكن.
Copyright© 2022 湘ICP备2022001581号-3