Las diferencias agrupadas en los pandas con múltiples campos
En esta situación, nuestro objetivo es calcular las diferencias en puntajes para diferentes sitios y combinaciones de países con el tiempo. fecha:
df = df.sort_values (by = ['Site', 'país', 'date'])
df = df.sort_values(by=['site', 'country', 'date'])
[&] df ['DiFf'] = df.grup 'país']) ['Score']. Diff (). Fillna (0)
df['diff'] = df.groupby(['site', 'country'])['score'].diff().fillna(0)
Finalmente, mostramos los resultados: (df) Producción: Fecha de puntaje del país del sitio Diff 8 2018-01-01 FB ES 100 0.0 9 2018-01-02 FB GB 100 0.0 5 2018-01-01 FB US 50 0.0 6 2018-01-02 FB US 55 5.0 7 2018-01-03 FB US 100 45.0 1 2018-01-01 Google CH 50 0.0 4 2018-01-02 Google CH 10 -40.0 0 2018-01-01 Google US 100 0.0 2 2018-01-02 Google US 70-30.0 3 2018-01-03 Google US 60 -10.0
Por favor, tenga en cuenta que la clasificación por orden arbitraria no es compatible directamente. Para tales escenarios, considere almacenar su pedido en una colección y hacer que su columna sea categórica. De esa manera, Sort_Values se alineará con el orden proporcionado.
Descargo de responsabilidad: Todos los recursos proporcionados provienen en parte de Internet. Si existe alguna infracción de sus derechos de autor u otros derechos e intereses, explique los motivos detallados y proporcione pruebas de los derechos de autor o derechos e intereses y luego envíelos al correo electrónico: [email protected]. Lo manejaremos por usted lo antes posible.
Copyright© 2022 湘ICP备2022001581号-3