」工欲善其事,必先利其器。「—孔子《論語.錄靈公》
首頁 > 程式設計 > 如何在熊貓中的特定列上有效刪除重複行?

如何在熊貓中的特定列上有效刪除重複行?

發佈於2025-03-23
瀏覽:405

How Can I Efficiently Remove Duplicate Rows Across Specific Columns in Pandas?
在python pandas

python pandas

例如,請考慮以下dataframe: a b c c 0 foo 0 a 1 foo 1 a 2 foo 1 b 3 bar 1 a

假設您要刪除在'a'和''和'C'列中具有相同值的行在這種情況下,將消除第0和1行。

先前,此任務需要手動過濾或複雜的操作。但是,隨著熊貓的增強drop_duplicates功能,現在變得輕而易舉。 Keep參數的引入使您可以控制重複的處理方式。

掉落在特定列上匹配的行,使用子集參數。通過設置為false,您可以指示大熊貓消除所有重複行:

導入pandas作為pd df = pd.dataframe({“ a”:[“ foo”,“ foo”,“ foo”,“ bar”],“ b”:[0,1,1,1],“ C”:[a“ a”,“ a”,“ b”,“ b”,“ A”}) df.drop_duplicates(subset = ['a','c'],keep = false)

2 foo 1 b 3 bar 1 a
    A   B   C
0   foo 0   A
1   foo 1   A
2   foo 1   B
3   bar 1   A
的唯一行的行。
最新教學 更多>

免責聲明: 提供的所有資源部分來自互聯網,如果有侵犯您的版權或其他權益,請說明詳細緣由並提供版權或權益證明然後發到郵箱:[email protected] 我們會在第一時間內為您處理。

Copyright© 2022 湘ICP备2022001581号-3