如何從數組長度不均勻的字典建構 Pandas DataFrame？

首頁 > 程式設計 > 如何從數組長度不均勻的字典建構 Pandas DataFrame？

如何從數組長度不均勻的字典建構 Pandas DataFrame？

發佈於2024-11-14

How to Construct Pandas DataFrames from Dictionaries with Uneven Array Lengths?

從數組長度不等的字典構造 DataFrames

在 Pandas 中處理具有不等長度數組的字典需要量身定制的方法。當嘗試建立一個DataFrame，其中每一列代表字典中的一個陣列時，可能會遇到ValueError：「陣列必須具有相同的長度。」

利用系列物件

來規避此問題問題，我們利用Pandas 的Series 物件來保存不同長度的陣列。透過將每個字典值轉換為 Series，我們可以有效地儲存數組，而不管它們的長度如何。以下程式碼片段示範了這種方法：

import pandas as pd
import numpy as np

# Sample data generated via a reproducible seed
np.random.seed(2023)
data = {k: np.random.randn(v) for k, v in zip("ABCDEF", [10, 12, 15, 17, 20, 23])}

# Convert dictionary values to Series objects
series_dict = {k: pd.Series(v) for k, v in data.items()}

# Create DataFrame using these Series objects
df = pd.DataFrame(series_dict)

保留缺失值

處理不同長度的陣列時，通常會遇到缺失值，其中較短的陣列無法填入剩餘的儲存格。預設情況下，Pandas 使用 NaN（非數字）值填入這些空白。此行為保留原始數據，同時提供一致的分析結構。

配置缺失值處理

如果需要，您可以使用 DataFrame 中的 Missing_values 參數自訂缺失值的處理（ ) 建構子。例如，若要以零取代NaN 取代缺失值，您可以指定missing_values=0，如下所示：

df = pd.DataFrame(series_dict, missing_values=0)

範例輸出

以下輸出說明了使用上述方法創建的DataFrame：

print(df)

      A         B         C         D         E         F
0  0.711674 -1.076522 -1.502178 -1.519748  0.340619  0.051132
1 -0.324485 -0.325682 -1.379593  2.097329 -1.253501 -0.238061
2 -1.001871 -1.035498 -0.204455  0.892562  0.370788 -0.208009
3  0.236251 -0.426320  0.642125  1.596488  0.455254  0.401304
4 -0.102160 -1.029361 -0.181176 -0.638762 -2.283720  0.183169
...       ...       ...       ...       ...       ...       ...
18       NaN       NaN       NaN       NaN       NaN       NaN
19       NaN       NaN       NaN       NaN       NaN       NaN
20       NaN       NaN       NaN       NaN       NaN       NaN
21       NaN       NaN       NaN       NaN       NaN       NaN
22       NaN       NaN       NaN       NaN       NaN       NaN
23 rows × 6 columns

如您所觀察到的，較短的陣列會在對應的儲存格中產生 NaN 值，從而提供資料的全面表示，同時保持所需的表格格式。

最新教學更多>

如何使用Python有效地以相反順序讀取大型文件？
在python 反向行讀取器生成器 == ord（'\ n'）：緩衝區=緩衝區[：-1] 剩餘_size- = buf_size lines = buffer.split（'\ n'....

程式設計發佈於2025-05-02
如何在整個HTML文檔中設計特定元素類型的第一個實例？

程式設計發佈於2025-05-02
如何使用“ JSON”軟件包解析JSON陣列？
parsing JSON與JSON軟件包 QUALDALS：考慮以下go代碼：字符串 } func main（）{ datajson：=`[“ 1”，“ 2”，“ 3”]`` arr：= jsontype {} 摘要：= = json.unmarshal（[] byte（...

程式設計發佈於2025-05-02
解決Spring Security 4.1及以上版本CORS問題指南
彈簧安全性cors filter：故障排除常見問題在將Spring Security集成到現有項目中時，您可能會遇到與CORS相關的錯誤，如果像“訪問Control-allo-allow-Origin”之類的標頭，則無法設置在響應中。為了解決此問題，您可以實現自定義過濾器，例如代碼段中的MyFi...

程式設計發佈於2025-05-02
如何解決Visual Studio中“類型或命名空間名'...'未找到”的錯誤？
解決Visual Studio中“找不到類型或命名空間名稱”錯誤在Visual Studio中引用項目時，如果遇到“找不到類型或命名空間名稱'PrjTest'（是否缺少using指令或程序集引用？）”錯誤，請按照以下步驟操作：驗證引用: 確保已正確將對項目(PrjTest)的引...

程式設計發佈於2025-05-02
如何使用Python理解有效地創建字典？
在python中，詞典綜合提供了一種生成新詞典的簡潔方法。儘管它們與列表綜合相似，但存在一些顯著差異。與問題所暗示的不同，您無法為鑰匙創建字典理解。您必須明確指定鍵和值。 For example:d = {n: n**2 for n in range(5)}This creates a dict...

程式設計發佈於2025-05-02
Python環境變量的訪問與管理方法
Accessing Environment Variables in PythonTo access environment variables in Python, utilize the os.environ object, which represents a mapping of envir...

程式設計發佈於2025-05-02
如何在Java的全屏獨家模式下處理用戶輸入？
在Java 中，以全屏幕獨立模式運行Java應用程序時，通常無法按期望的工作可能無法使用JAVA應用程序時，將用戶輸入在Java ProblemPassive rendering mode allows the use of KeyListener and ActionListener inter...

程式設計發佈於2025-05-02
$找到最大計數時，如何解決mySQL中的“組函數\”錯誤的“無效使用”？$
找到最大計數時，如何解決mySQL中的“組函數\”錯誤的“無效使用”？
如何在mySQL中使用mySql 檢索最大計數，您可能會遇到一個問題，您可能會在嘗試使用以下命令：理解錯誤正確找到由名稱列分組的值的最大計數，請使用以下修改後的查詢：計數（*）為c 來自EMP1 按名稱組 c desc訂購限制1 查詢說明 select語句提取名稱列和每個名稱...

程式設計發佈於2025-05-02
在Oracle SQL中如何提取下劃線前的子字符串？
[ 在oracle sql 解決方案： Explanation:SUBSTR function extracts a substring starting from the specified position (0) and continuing for a specified length.IN...

程式設計發佈於2025-05-02
如何使用不同數量列的聯合數據庫表？
合併列數不同的表當嘗試合併列數不同的數據庫表時，可能會遇到挑戰。一種直接的方法是在列數較少的表中，為缺失的列追加空值。例如，考慮兩個表，表 A 和表 B，其中表 A 的列數多於表 B。為了合併這些表，同時處理表 B 中缺失的列，請按照以下步驟操作：確定表 B 中缺失的列，並將它們添加到表的...

程式設計發佈於2025-05-02
PHP如何處理多個同名POST輸入？
通過php 在Web開發中傳遞具有相同名稱的多個輸入，表單通常會收集具有相同名稱的多個輸入。在PHP中，訪問這些輸入可能具有挑戰性。本文探討了通過php中的POST請求接收和處理具有相同名稱的多個輸入的可行性。 php的數組結構在PHP中，具有相同名稱的輸入被存儲為作為數組元素的元素。每個元素都...

程式設計發佈於2025-05-02
為什麼使用Firefox後退按鈕時JavaScript執行停止？
導航歷史記錄問題：JavaScript使用Firefox Back Back 此行為是由瀏覽器緩存JavaScript資源引起的。要解決此問題並確保在後續頁面訪問中執行腳本，Firefox用戶應設置一個空功能。警報'）; }; alert（'inline Alert'）...

程式設計發佈於2025-05-02
如何從PHP中的Unicode字符串中有效地產生對URL友好的sl。
為有效的slug生成首先，該函數用指定的分隔符替換所有非字母或數字字符。此步驟可確保slug遵守URL慣例。隨後，它採用ICONV函數將文本簡化為us-ascii兼容格式，從而允許更廣泛的字符集合兼容性。接下來，該函數使用正則表達式刪除了不需要的字符，例如特殊字符和空格。此步驟可確保slug僅包...

程式設計發佈於2025-05-02
如何實時捕獲和流媒體以進行聊天機器人命令執行？
在開發能夠執行命令的chatbots的領域中，實時從命令執行實時捕獲Stdout，一個常見的需求是能夠檢索和顯示標準輸出（stdout）在cath cath cant cant cant cant cant cant cant cant interfaces in Chate cant inter...

程式設計發佈於2025-05-02