pandas 在带有后缀的熊猫中嵌套合并

Question

提问by EMiller

I'm trying to merge multiple dataframes in pandas and keep the column labels straight in the resulting dataframe. Here's my test case:

我正在尝试合并 Pandas 中的多个数据帧，并在生成的数据帧中保持列标签笔直。这是我的测试用例：

import pandas as pd
df1 = pd.DataFrame(data = [[1,1],[3,1],[5,1]], columns = ['key','val'])
df2 = pd.DataFrame(data = [[1,2],[3,2],[7,2]], columns = ['key','val'])
df3 = pd.DataFrame(data = [[1,3],[2,3],[4,3]], columns = ['key','val'])
df = pd.merge(pd.merge(df1,df2,on='key', suffixes=['_1','_2']),df3,on='key',suffixes=[None,'_3'])

I'm getting this:

我得到这个：

df =
     key    val_1   val_2   val
0     1       1      2       3

I'd like to see this:

我想看看这个：

df =
     key    val_1   val_2   val_3
0     1       1      2       3

The last pair of suffixes that I've specified is: [None,'_3'], the logic being that the pair ['_1','_2']has created unique column names for the previous merge.

我指定的最后一对后缀是: [None,'_3']，逻辑是这对后缀['_1','_2']为上一次合并创建了唯一的列名。

Answer 1

回答by Vaishali

The suffix is needed only when the merged dataframe has two columns with same name. When you merge df3, your dataframe has column names val_1 and val_2 so there is no overlap. You can handle that by renaming val to val_3 like this

仅当合并的数据框有两列同名时才需要后缀。当您合并 df3 时，您的数据框具有列名 val_1 和 val_2，因此没有重叠。您可以通过将 val 重命名为 val_3 来处理这个问题

df = df1.merge(df2, on = 'key', suffixes=['_1','_2']).merge(df3, on = 'key').rename(columns = {'val': 'val_3'})

pandas 在带有后缀的熊猫中嵌套合并

提问by EMiller

回答by Vaishali

相关推荐

最近更新

标签

pandas 在带有后缀的熊猫中嵌套合并

提问by EMiller

回答by Vaishali

相关推荐

pandas 按字符串长度对数据框进行排序

python / pandas 查找两个日期之间的年数

将请求中的 JSON 数据转换为 Pandas DataFrame

来自两个 Pandas 数据框的分组条形图

相关推荐

最近更新

标签