pandas 熊猫：聚合给定列的行并计算数量

Question

提问by Edamame

I have the following data frame my_df:

我有以下数据框my_df：

team      member
--------------------    
 A         Mary
 B         John
 C         Amy
 A         Dan
 B         Dave
 D         Paul
 B         Alex
 A         Mary
 D         Mary

I want the new output the new data frame new_dfas:

我希望新数据框的新输出new_df为：

team      members              number
--------------------------------------
 A       [Mary,Dan]              2
 B       [John,Dave,Alex]        3
 C       [Amy]                   1
 D       [Paul,Mary]             2

I am wondering is there any existing pandas function can perform the above task? Thanks!

我想知道是否有任何现有的 Pandas 函数可以执行上述任务？谢谢！

Answer 1

采纳答案by piRSquared

using groupby

使用 groupby

pd.concat

g = df.groupby('team').member
pd.concat([g.apply(list), g.count()], axis=1, keys=['members', 'number'])

agg

g = df.groupby('team').member
g.agg(dict(members=lambda x: list(x), number='count'))

                 members  number
team                            
A            [Mary, Dan]       2
B     [John, Dave, Alex]       3
C                  [Amy]       1
D                 [Paul]       1

Answer 2

回答by Psidom

Another option here:

这里的另一个选择：

(df.groupby("team", as_index=False).member
   .agg({"member": lambda x: list(x), "count": "count"}))

Answer 3

回答by racket99

using lambda:

使用lambda：

newdf=pd.DataFrame()
newdf['team']=my_df['team'].unique()
newdf['members']=newdf['team'].map(lambda x:list(my_df[my_df['team']==x]['member']))
newdf['number']=newdf.members.map(lambda x: len(x))
newdf.set_index('team',inplace=True)

pandas 熊猫：聚合给定列的行并计算数量

提问by Edamame

采纳答案by piRSquared

回答by Psidom

回答by racket99

相关推荐

最近更新

标签

pandas 熊猫：聚合给定列的行并计算数量

提问by Edamame

采纳答案by piRSquared

回答by Psidom

回答by racket99

相关推荐

在 Python pandas DataFrame 中为数字添加千位分隔符的简单方法

使用 Pandas read_html 的问题

pandas 熊猫将两列与空值组合在一起

使用 Pandas 查找分组行的最小值

相关推荐

最近更新

标签