يعد حساب القيم الفريدة المجمعة بواسطة عمود معين مهمة شائعة في تحليل البيانات. يوفر Pandas طرقًا مختلفة لتحقيق ذلك.
في حالتك، لديك DataFrame مع أعمدة "ID" و"domain" وتحتاج إلى حساب قيم "ID" فريدة لكل "مجال".
] &&&]استخدام df.groupby['domain', 'ID'].count()':
تقوم هذه الطريقة بإرجاع DataFrame مع أعداد لكل من مجموعات 'ID' و'domain' . ومع ذلك، فهو يحسب عدد الصفوف في كل مجموعة، وليس فقط قيم "المعرف" الفريدة.الحل باستخدام `nunique()':df.groupby ('domain')['ID'].nunique() يحسب عدد "ID" الفريد لكل مجموعة "مجال". سيحتوي DataFrame الناتج على عمود "المجال" كمؤشر والعدد كعمود جديد.
تجريد علامات الاقتباس المفردة:
إذا كان عمود "المجال" الخاص بك يحتوي على علامات الاقتباس المفردة، استخدم df.domain.str.strip("'") لإزالتها قبل التجميع.
احتفظ باسم العمود:للاحتفاظ بـ 'ID' اسم العمود في النتيجة، استخدم df.groupby(by='domain', as_index=False).agg({'ID': pd.Series.nunique}). سيؤدي هذا إلى إنشاء DataFrame بعمودي "المجال" و"المعرف" (العدد الفريد).
تنصل: جميع الموارد المقدمة هي جزئيًا من الإنترنت. إذا كان هناك أي انتهاك لحقوق الطبع والنشر الخاصة بك أو الحقوق والمصالح الأخرى، فيرجى توضيح الأسباب التفصيلية وتقديم دليل على حقوق الطبع والنشر أو الحقوق والمصالح ثم إرسالها إلى البريد الإلكتروني: [email protected]. سوف نتعامل مع الأمر لك في أقرب وقت ممكن.
Copyright© 2022 湘ICP备2022001581号-3