pandas 按多列分组以查找重复行熊猫

Question

提问by Shubham R

i have a df

我有一个 df

id    val1    val2
 1     1.1      2.2
 1     1.1      2.2
 2     2.1      5.5
 3     8.8      6.2
 4     1.1      2.2
 5     8.8      6.2

I want to group by val1 and val2and get similar dataframe only with rows which has multiple occurance of same val1 and val2combination.

我想val1 and val2仅对具有相同val1 and val2组合多次出现的行进行分组并获得类似的数据帧。

Final df:

最终 df：

id    val1    val2
 1     1.1      2.2
 4     1.1      2.2
 3     8.8      6.2
 5     8.8      6.2

Answer 1

回答by jezrael

You need duplicatedwith parameter subsetfor specify columns for check with keep=Falsefor all duplicates for mask and filter by boolean indexing:

您需要duplicated使用参数subset来指定用于检查keep=False掩码和过滤器的所有重复项的列boolean indexing：

df = df[df.duplicated(subset=['val1','val2'], keep=False)]
print (df)
   id  val1  val2
0   1   1.1   2.2
1   1   1.1   2.2
3   3   8.8   6.2
4   4   1.1   2.2
5   5   8.8   6.2

Detail:

细节：

print (df.duplicated(subset=['val1','val2'], keep=False))
0     True
1     True
2    False
3     True
4     True
5     True
dtype: bool

pandas 按多列分组以查找重复行熊猫

提问by Shubham R

回答by jezrael

相关推荐

最近更新

标签

pandas 按多列分组以查找重复行熊猫

提问by Shubham R

回答by jezrael

相关推荐

使用 Pandas 循环读取 CSV 文件，然后将它们连接起来

从 python/pandas 中的日期/时间格式计算年龄

Pandas 从日期类型列中获取星期几

如何在 Pandas 数据框列中搜索特定文本？

相关推荐

最近更新

标签