Ersetzen von Leerwerten durch NaN in Pandas
In Pandas-Datenrahmen ist es häufig erforderlich, Leerraumwerte („“) zu identifizieren und durch zu ersetzen NaN-Werte. Dieser Vorgang stellt die Datenintegrität sicher und ermöglicht eine nahtlose Analyse.
Eine effiziente Möglichkeit, dies zu erreichen, ist die Pandas-Methode replace(). Seine Syntax lautet wie folgt:
df.replace(to_replace, value, regex=True)
In diesem Kontext:
Um Leerwerte durch NaN zu ersetzen, können Sie den folgenden Code verwenden:
import pandas as pd
import numpy as np
# Create a sample dataframe
df = pd.DataFrame({
"A": [-0.532681, 1.490752, -1.387326, 0.814772, -0.222552, -1.176781],
"B": ['foo', 'bar', 'foo', 'baz', ' ','qux'],
"C": [0, 1, 2, ' ', 4, ' ']
})
# Replace blank values with NaN
df = df.replace(r'^\s*$', np.nan, regex=True)
# Display the updated dataframe
print(df)
Ausgabe:
A B C 0 -0.532681 foo 0 1 1.490752 bar 1 2 -1.387326 foo 2 3 0.814772 baz NaN 4 -0.222552 NaN 4 5 -1.176781 qux NaN
Dieser Code ersetzt effektiv alle leeren Werte im Datenrahmen durch NaN und sorgt so für eine sauberere und genauere Darstellung Ihrer Daten.
Haftungsausschluss: Alle bereitgestellten Ressourcen stammen teilweise aus dem Internet. Wenn eine Verletzung Ihres Urheberrechts oder anderer Rechte und Interessen vorliegt, erläutern Sie bitte die detaillierten Gründe und legen Sie einen Nachweis des Urheberrechts oder Ihrer Rechte und Interessen vor und senden Sie ihn dann an die E-Mail-Adresse: [email protected] Wir werden die Angelegenheit so schnell wie möglich für Sie erledigen.
Copyright© 2022 湘ICP备2022001581号-3