पांडा ग्रुपबी और समूहों के भीतर सॉर्टिंग
डेटा फ़्रेम को एकाधिक कॉलम द्वारा समूहीकृत करना डेटा हेरफेर में एक सामान्य कार्य है। यह हमें इन स्तंभों द्वारा डेटा एकत्र करने और एकत्रित परिणामों पर आगे के संचालन करने की अनुमति देता है। हालाँकि, शीर्ष या निचली पंक्तियों को प्राप्त करने के लिए प्रत्येक समूह के भीतर एकत्रित परिणामों को क्रमबद्ध करना अक्सर आवश्यक होता है।
प्रश्न में दिए गए डेटाफ़्रेम डीएफ पर विचार करें:
count job source 0 2 sales A 1 4 sales B 2 6 sales C 3 3 sales D 4 7 sales E 5 5 market A 6 3 market B 7 2 market C 8 4 market D 9 1 market E
लक्ष्य डीएफ को नौकरी और स्रोत कॉलम के आधार पर समूहित करना है और फिर प्रत्येक समूह के भीतर 'गिनती' कॉलम को अवरोही क्रम में क्रमबद्ध करना है। इसे प्राप्त करने के लिए, हम ग्रुपबाय() और सॉर्ट_वैल्यूज़() फ़ंक्शन का उपयोग इस प्रकार कर सकते हैं:
df.groupby(['job', 'source'])['count'].sum().sort_values(ascending=False)
यह प्रत्येक समूह के भीतर 'गिनती' कॉलम को घटते क्रम में क्रमबद्ध करेगा, निम्नलिखित आउटपुट प्रदान करेगा:
job source sales E 7 C 6 B 4 D 3 A 2 market A 5 D 4 B 3 C 2 E 1
हालाँकि, यदि हम प्रत्येक समूह के भीतर केवल शीर्ष तीन पंक्तियाँ प्राप्त करना चाहते हैं, तो हम हेड() फ़ंक्शन का उपयोग कर सकते हैं:
df.groupby(['job', 'source'])['count'].sum().sort_values(ascending=False).groupby('job').head(3)
यह हमें निम्नलिखित परिणाम देगा:
count job source 4 7 sales E 2 6 sales C 1 4 sales B 5 5 market A 8 4 market D 6 3 market B
ग्रुपबाय(), सॉर्ट_वैल्यूज़(), और हेड() फ़ंक्शंस को मिलाकर, हम पांडा में प्रत्येक समूह के भीतर प्रभावी ढंग से समूह, सॉर्ट और शीर्ष या निचली पंक्तियों का चयन कर सकते हैं।
अस्वीकरण: उपलब्ध कराए गए सभी संसाधन आंशिक रूप से इंटरनेट से हैं। यदि आपके कॉपीराइट या अन्य अधिकारों और हितों का कोई उल्लंघन होता है, तो कृपया विस्तृत कारण बताएं और कॉपीराइट या अधिकारों और हितों का प्रमाण प्रदान करें और फिर इसे ईमेल पर भेजें: [email protected] हम इसे आपके लिए यथाशीघ्र संभालेंगे।
Copyright© 2022 湘ICP备2022001581号-3