分区上的聚合 - pandas Dataframe

Question

提问by Ivan KR

I am looking for the best way to aggregate values based on a particular partition , an equivalent of

我正在寻找基于特定分区聚合值的最佳方法，相当于

SUM(TotalCost) OVER(PARTITION BY ShopName) Earnings  ( SQL server)

I am able to do this by the following steps in Pandas , but looking for a native approach which I am sure should exist

我可以通过 Pandas 中的以下步骤来做到这一点，但正在寻找一种我确信应该存在的本机方法

TempDF= DF.groupby(by=['ShopName'])['TotalCost'].sum()

TempDF= TempDF.reset_index() 

NewDF=pd.merge(DF , TempDF, how='inner', on='ShopName')

Thanks a lot for reading through !

非常感谢您通读！

Answer 1

回答by Anton Kargapolov

You can use pandas transform() method for within group aggregations like "OVER(partition by ...)" in SQL:

您可以在 SQL 中将 pandas transform() 方法用于组内聚合，例如“OVER(partition by ...)”：

import pandas as pd
import numpy as np

#create dataframe with sample data
df = pd.DataFrame({'group':['A','A','A','B','B','B'],'value':[1,2,3,4,5,6]})

#calculate AVG(value) OVER (PARTITION BY group)
df['mean_value'] = df.groupby('group').value.transform(np.mean)

df:
group   value   mean_value
A       1       2
A       2       2
A       3       2
B       4       5
B       5       5
B       6       5

分区上的聚合 - pandas Dataframe

提问by Ivan KR

回答by Anton Kargapolov

相关推荐

最近更新

标签

分区上的聚合 - pandas Dataframe

提问by Ivan KR

回答by Anton Kargapolov

相关推荐

PANDAS Group通过删除标题

pandas 在熊猫数据框中的任何列中删除带有“问号”值的行

pandas 为什么将熊猫导入为 pd 是惯例？

pandas 创建数据框字典

相关推荐

最近更新

标签