如何在 Pandas 中迭代 MultiIndex 级别？

Question

提问by Gerenuk

I often have MultiIndex indices and I'd like to iterate over groups where higher level indices are equal. It basically looks like

我经常有 MultiIndex 索引，我想迭代更高级别索引相等的组。它基本上看起来像

from random import choice
import pandas as pd
N = 100
df = pd.DataFrame([choice([1, 2, 3]) for _ in range(N)],
                  columns=["A"],
                  index=pd.MultiIndex.from_tuples([(choice("ab"), choice("cd"), choice("de")) 
                                                   for _ in range(N)]))

for idx in zip(df.index.get_level_values(0), df.index.get_level_values(1)):
    df_select = df.ix[idx]

Is there a way to do the for loop iteration more neatly?

有没有办法更巧妙地进行for循环迭代？

Answer 1

回答by Mzzzzzz

Use groupby. The index of the df_selectview includes the first two level values, but otherwise is similar to your example.

使用groupby. df_select视图的索引包括前两个级别值，但其他方面与您的示例类似。

for idx, df_select in df.groupby(level=[0, 1]):
    ...

Answer 2

回答by rstreppa

Alternatively to groupby logic you can use a lambda function, which has the advantage of not having to specify the number of levels, i.e. it will pick all levels except the very last one:

作为 groupby 逻辑的替代方案，您可以使用 lambda 函数，它的优点是不必指定级别数，即它将选择除最后一个级别之外的所有级别：

for idx in df.index.map(lambda x: x[:-1]):
 df_select=df.ix[idx]

如何在 Pandas 中迭代 MultiIndex 级别？

提问by Gerenuk

回答by Mzzzzzz

回答by rstreppa

相关推荐

最近更新

标签

如何在 Pandas 中迭代 MultiIndex 级别？

提问by Gerenuk

回答by Mzzzzzz

回答by rstreppa

相关推荐

pandas AttributeError: 未知属性 color_cycle

将 pandas DataFrame query() 方法与 isin() 结合使用

pandas 计算所有列之间的成对相关性

pandas Scikit-learn - 多项逻辑回归的错误输入形状错误

相关推荐

最近更新

标签