किसी विशिष्ट कॉलम द्वारा समूहीकृत अद्वितीय मानों की गणना करना डेटा विश्लेषण में एक सामान्य कार्य है। पांडा इसे प्राप्त करने के लिए विभिन्न तरीके प्रदान करता है।
आपके मामले में, आपके पास 'आईडी' और 'डोमेन' कॉलम के साथ एक डेटाफ़्रेम है और प्रत्येक 'डोमेन' के लिए अद्वितीय 'आईडी' मानों की गणना करने की आवश्यकता है।
df.groupby['domain', 'ID'].count()' का उपयोग करना:
यह विधि 'आईडी' और 'डोमेन' दोनों समूहों के लिए गिनती के साथ एक डेटाफ़्रेम लौटाती है . हालाँकि, यह प्रत्येक समूह में पंक्तियों की संख्या की गणना करता है, न कि केवल अद्वितीय 'आईडी' मानों की।
Solution with `nunique()':
df.groupby ('domain')['ID'].nunique() प्रत्येक 'डोमेन' समूह के लिए अद्वितीय 'ID' गणना की गणना करता है। परिणामी डेटाफ़्रेम में सूचकांक के रूप में 'डोमेन' कॉलम और एक नए कॉलम के रूप में गिनती होगी।
स्ट्रिपिंग सिंगल कोट्स:
यदि आपके 'डोमेन' कॉलम में शामिल है एकल उद्धरण, समूहीकरण से पहले उन्हें हटाने के लिए df.domain.str.strip("'") का उपयोग करें।
कॉलम नाम सुरक्षित रखें:
'आईडी' रखने के लिए परिणाम में कॉलम नाम, df.groupby(by='domain', as_index=False).agg({'ID': pd.Series.nunique}) का उपयोग करें। यह 'डोमेन' और 'आईडी' (अद्वितीय गणना) कॉलम के साथ एक डेटाफ़्रेम बनाएगा।
अस्वीकरण: उपलब्ध कराए गए सभी संसाधन आंशिक रूप से इंटरनेट से हैं। यदि आपके कॉपीराइट या अन्य अधिकारों और हितों का कोई उल्लंघन होता है, तो कृपया विस्तृत कारण बताएं और कॉपीराइट या अधिकारों और हितों का प्रमाण प्रदान करें और फिर इसे ईमेल पर भेजें: [email protected] हम इसे आपके लिए यथाशीघ्र संभालेंगे।
Copyright© 2022 湘ICP备2022001581号-3