pandas 在函数中使用 groupby 组名

Question

提问by Jeremy

I have data something like:

我有类似的数据：

df = pd.DataFrame({'user': np.random.choice(['a', 'b','c'], size=100, replace=True),
                   'value1': np.random.randint(10, size=100),
                   'value2': np.random.randint(20, size=100)})

I'm using it to produce some results, e.g.,

我用它来产生一些结果，例如，

grouped = df.groupby('user')
results = pd.DataFrame()
results['value2_sum'] = grouped['value2'].sum()

For one of he columns of this result dataframe, I'd like to pass the user names to a different function, which uses data outside of the dataframe.

对于此结果数据帧的其中一列，我想将用户名传递给不同的函数，该函数使用数据帧之外的数据。

I tried something like:

我试过类似的东西：

results['user_result'] = grouped.apply(lambda x: my_func(x.index))

But couldn't figure out a syntax that worked.

但无法找出有效的语法。

Answer 1

回答by EdChum

You want the .nameattribute to access a groups index value:

您希望该.name属性访问组索引值：

In [6]:
grouped = df.groupby('user')
results = pd.DataFrame()
results['value2_sum'] = grouped['value2'].sum()
results['user_result'] = grouped.apply(lambda x: x.name)
results

Out[6]:
      value2_sum user_result
user                        
a            342           a
b            333           b
c            308           c

Answer 2

回答by Alexander

results['user_result'] = results.index.values

To pass the index value to your function, you can use a list comprehension.

要将索引值传递给您的函数，您可以使用列表推导式。

def my_func(val):
    return val + "_" + val

results['my_func'] = [my_func(idx) for idx in results.index]

>>> results
      value2_sum user_result my_func
user                                
a            417           a     a_a
b            306           b     b_b
c            331           c     c_c

pandas 在函数中使用 groupby 组名

提问by Jeremy

回答by EdChum

回答by Alexander

相关推荐

最近更新

标签

pandas 在函数中使用 groupby 组名

提问by Jeremy

回答by EdChum

回答by Alexander

相关推荐

Pandas - 根据日期时间列值删除 DataFrame 行

pandas Python从数据中删除异常值

pandas 使用 groupby 有效地在大型数据帧上填充（前向填充）？

将 Pandas 数据帧对象传递给函数

相关推荐

最近更新

标签