переселение данных от долгого до широкого в пандах: Комплексное руководство
многие наборы изначально хранятся в длинном формате, где каждая строка представляет единое наблюдение, и множественные переменные перечислены как столбцы. Тем не менее, часто становится необходимым изменить данные в широкий формат, где каждая строка соответствует уникальной комбинации значений из двух или более переменных.
Выпуск: Преобразование данных из длинных в широкое формат может быть громоздкой задачей в пандах, особенно при использовании методов Melt/Stack/unsuck. Например, рассмотрим следующий длинноформатный данных DataFrame:
import pandas as pd
data = pd.DataFrame({
'Salesman': ['Knut', 'Knut', 'Knut', 'Steve'],
'Height': [6, 6, 6, 5],
'product': ['bat', 'ball', 'wand', 'pen'],
'price': [5, 1, 3, 2]
})
пересекающий в широкий формат:
, чтобы изменить данные в широкий формат, мы можем использовать решение Криса Альбона:
raveframe:
raw_data = {
'patient': [1, 1, 1, 2, 2],
'obs': [1, 2, 3, 1, 2],
'treatment': [0, 1, 0, 1, 0],
'score': [6252, 24243, 2345, 2342, 23525]
}
df = pd.DataFrame(raw_data, columns=['patient', 'obs', 'treatment', 'score'])
reshape to wide:
df.pivot(index='patient', columns='obs', values='score')
] obs 1 2 3 пациент 1 6252.0 24243.0 2345.0 2 2342.0 23525.0 NAN
]Отказ от ответственности: Все предоставленные ресурсы частично взяты из Интернета. В случае нарушения ваших авторских прав или других прав и интересов, пожалуйста, объясните подробные причины и предоставьте доказательства авторских прав или прав и интересов, а затем отправьте их по электронной почте: [email protected]. Мы сделаем это за вас как можно скорее.
Copyright© 2022 湘ICP备2022001581号-3