dividir las cadenas de datos de datos separadas por comas en las filas separadas
, a menudo se encuentra que se encuentra a menudo una o más columnas contienen valores separados en comodidad (CSV) que deben dividirse en Rows individuales. Para lograr esto, se pueden emplear varios enfoques:
usando series.explode () o dataFrame.explode () :
Este método está disponible en pandas 0.25.0 y arriba y está diseñado específicamente para explotar listada de lista columnas.
df.explode('column_name')
usando una función vectorizada :
para situaciones que involucran múltiples columnas normales y múltiples, una función vectorizada puede proporcionar una solución más versatil. relleno_value = '', preserve_index = falso): # ... (Detalles de implementación)
def explode(df, lst_cols, fill_value='', preserve_index=False): # ... (implementation details)Convertir cadenas CSV en listas
: Si el objetivo es únicamente para convertir las cadenas de CSV en listas, esto se puede lograr dividiendo las vistas usando Str.Split ().
DF ['Var1'] df ['var1']. str.split (',')
df['var1'] = df['var1'].str.split(','):
] Este enfoque puede manejar múltiples columnas, incluidas las columnas normales y de lista. col: np.repeat (x [col] .values, x [lst_col] .str.len ()) para col en x.columns.diferference ([lst_col]) }. .Reset_index () para dividir las cadenas CSV y apilarlas en filas individuales.
estos enfoques ofrecen varias opciones para dividir las cadenas separadas por comas en los marcos de datos de pandas, atendiendo requisitos específicos y consideraciones de rendimiento.Descargo de responsabilidad: Todos los recursos proporcionados provienen en parte de Internet. Si existe alguna infracción de sus derechos de autor u otros derechos e intereses, explique los motivos detallados y proporcione pruebas de los derechos de autor o derechos e intereses y luego envíelos al correo electrónico: [email protected]. Lo manejaremos por usted lo antes posible.
Copyright© 2022 湘ICP备2022001581号-3