如何有效率地過濾具有多個條件的 Pandas DataFrame 或 Series？

首頁 > 程式設計 > 如何有效率地過濾具有多個條件的 Pandas DataFrame 或 Series？

如何有效率地過濾具有多個條件的 Pandas DataFrame 或 Series？

發佈於2024-11-01

How to Efficiently Filter Pandas DataFrame or Series with Multiple Conditions?

多重條件高效過濾Pandas DataFrame或Series

Pandas提供了多種過濾資料的方法，包括reindex()、apply()和map() 。然而，當應用多個過濾器時，效率就成為一個問題。

為了優化過濾，請考慮使用布林索引。 Pandas 和 Numpy 都支援布林索引，它直接對底層資料數組進行操作，而不創建不必要的副本。

下面是布林索引的範例：

df.loc[df['col1'] >= 1, 'col1']

此表達式返回僅包含「col1」欄位中的值大於或等於1 的行的Pandas Series。

To應用多個篩選器，使用邏輯運算子「&」（AND）和「|」（或）。例如：

df[(df['col1'] >= 1) & (df['col1'] <=1 )]

此表達式傳回一個DataFrame，僅包含列'col1' 中的值在1 和1 之間（含1 和1）的行。

For輔助函數，考慮定義採用 DataFrame 並傳回布林系列的函數，讓您可以使用邏輯運算子組合多個篩選器。

def b(x, col, op, n):
    return op(x[col],n)

def f(x, *b):
    return x[(np.logical_and(*b))]

Pandas 0.13 引入了 query() 方法，它提供了一種更有效的方式來表達複雜的過濾條件。假設列標識符有效，以下程式碼根據多個條件過濾DataFrame df：

df.query('col1 <= 1 & 1 <= col1')

總之，布爾索引提供了一種將多個過濾器應用於Pandas DataFrame 或Series 的有效方法，而無需建立不必要的副本。使用邏輯運算子和輔助函數組合多個篩選器以實現擴充功能。

版本聲明本文轉載於：1729394837如有侵犯，請洽[email protected]刪除

最新教學更多>

如何使用PHP將斑點（圖像）正確插入MySQL？
essue VALUES('$this->image_id','file_get_contents($tmp_image)')";This code builds a string in PHP, but the function call fil...

程式設計發佈於2025-07-22
Python中嵌套函數與閉包的區別是什麼
嵌套函數與python 在python中的嵌套函數不被考慮閉合，因為它們不符合以下要求：不訪問局部範圍scliables to incling scliables在封裝範圍外執行範圍的局部範圍。 make_printer（msg）： DEF打印機（）：打印（味精） ...

程式設計發佈於2025-07-22
在C#中如何高效重複字符串字符用於縮進？
在基於項目的深度下固定字符串時，重複一個字符串以進行凹痕，很方便有效地有一種有效的方法來返回字符串重複指定的次數的字符串。使用指定的次數。 constructor 這將返回字符串“ -----”。字符串凹痕= new String（' - '，depth）; console.W...

程式設計發佈於2025-07-22
您可以使用CSS在Chrome和Firefox中染色控制台輸出嗎？
在javascript console 中顯示顏色是可以使用chrome的控制台顯示彩色文本，例如紅色的redors，for for for for錯誤消息？回答是的，可以使用CSS將顏色添加到Chrome和Firefox中的控制台顯示的消息（版本31或更高版本）中。要實現這一目標，請使用以下...

程式設計發佈於2025-07-22
Async Void vs. Async Task在ASP.NET中：為什麼Async Void方法有時會拋出異常？
在ASP.NET async void void async void void void void void的設計無需返回asynchroncon而無需返回任務對象。他們在執行過程中增加未償還操作的計數，並在完成後減少。在某些情況下，這種行為可能是有益的，例如未期望或明確預期操作結果的火災和...

程式設計發佈於2025-07-22
如何從PHP中的數組中提取隨機元素？
從陣列中的隨機選擇，可以輕鬆從數組中獲取隨機項目。考慮以下數組：; 從此數組中檢索一個隨機項目，利用array_rand（ array_rand（）函數從數組返回一個隨機鍵。通過將$項目數組索引使用此鍵，我們可以從數組中訪問一個隨機元素。這種方法為選擇隨機項目提供了一種直接且可靠的方法。

程式設計發佈於2025-07-22
如何為PostgreSQL中的每個唯一標識符有效地檢索最後一行？
postgresql：為每個唯一標識符提取最後一行，在Postgresql中，您可能需要遇到與在數據庫中的每個不同標識相關的信息中提取信息的情況。考慮以下數據：[ 1 2014-02-01 kjkj 在數據集中的每個唯一ID中檢索最後一行的信息，您可以在操作員上使用Postgres的有效效率： ...

程式設計發佈於2025-07-22
如何在整個HTML文檔中設計特定元素類型的第一個實例？

程式設計發佈於2025-07-22
編譯器報錯“usr/bin/ld: cannot find -l”解決方法
錯誤：“ usr/bin/ld：找不到-l “ 此錯誤表明鏈接器在鏈接您的可執行文件時無法找到指定的庫。為了解決此問題，我們將深入研究如何指定庫路徑並將鏈接引導到正確位置的詳細信息。添加庫搜索路徑的一個可能的原因是，此錯誤是您的makefile中缺少庫搜索路徑。要解決它，您可以在鏈接器命令中添...

程式設計發佈於2025-07-22
左連接為何在右表WHERE子句過濾時像內連接？
左JOIN CONUNDRUM：WITCHING小時在數據庫Wizard的領域中變成內在的加入很有趣，當將c.foobar條件放置在上面的Where子句中時，據說左聯接似乎會轉換為內部連接。僅當滿足A.Foo和C.Foobar標準時，才會返回結果。為什麼要變形？關鍵在於其中的子句。當左聯接的右側...

程式設計發佈於2025-07-22
Java字符串非空且非null的有效檢查方法
檢查字符串是否不是null而不是空的 if（str！= null && str.isementy（））二手： if（str！= null && str.length（）== 0） option 3：trim（）。 isement（Isement（） trim whitespace whites...

程式設計發佈於2025-07-22
Python中何時用"try"而非"if"檢測變量值？
使用“ try“ vs.” if”來測試python 在python中的變量值，在某些情況下，您可能需要在處理之前檢查變量是否具有值。在使用“如果”或“ try”構建體之間決定。 “ if” constructs result = function（）如果結果：對於結果： ...

程式設計發佈於2025-07-22
$解決MySQL插入Emoji時出現的\\"字符串值錯誤\\"異常$
解決MySQL插入Emoji時出現的\\"字符串值錯誤\\"異常
Resolving Incorrect String Value Exception When Inserting EmojiWhen attempting to insert a string containing emoji characters into a MySQL database us...

程式設計發佈於2025-07-22
用戶本地時間格式及時區偏移顯示指南
在用戶的語言環境格式中顯示日期/時間，並使用時間偏移在向最終用戶展示日期和時間時，以其localzone and格式顯示它們至關重要。這確保了不同地理位置的清晰度和無縫用戶體驗。以下是使用JavaScript實現此目的的方法。方法：推薦方法是處理客戶端的Javascript中的日期/時間格式化和...

程式設計發佈於2025-07-22
在GO中構造SQL查詢時，如何安全地加入文本和值？
在go中構造文本sql查詢時，在go sql queries 中，在使用conting and contement和contement consem per時，尤其是在使用integer per當per當per時，per per per當per. 在GO中實現這一目標的慣用方法是使用fmt.spr...

程式設計發佈於2025-07-22