pandas 合并熊猫列（一对多）

Question

提问by Andi Maier

I am new to python pandas in which I want to combine several Excel sheets by a common ID. Besides, there it is a one-to-many relationship.

我是 python pandas 的新手，我想通过一个公共 ID 组合多个 Excel 工作表。此外，它是一对多的关系。

Here is the input:

这是输入：

df1

<b>ID       Name</b><br/>
3763058 Andi<br/>
3763077 Mark

and

和

df2:

df2：

<b>ID   Tag</b><br/>
3763058 item1 <br/>
3763058 item2<br/>
3763058 item3<br/>
3763077 item_4<br/>
3763077 item_5<br/>
3763077 item_6

I would now like to merge the two pandas data frames df1 and df2 into the following output (the column tag is merged in a single column per ID):

我现在想将两个 Pandas 数据帧 df1 和 df2 合并到以下输出中（列标记合并为每个 ID 的单个列）：

<b>ID   Name    Tag</b><br/>
3763058 Andi    item1, item2, item3<br/>
3763077 Mark    item_4, item_5, item_6<br/>

Could anybody please help me with this?

有人可以帮我解决这个问题吗？

Cheers, Andi

干杯，安迪

Answer 1

回答by jezrael

You can use first groupbywith join:

您可以首先groupby使用join：

df2 = df2.groupby('ID')['Tag'].apply(', '.join).reset_index()
print (df2)
        ID                     Tag
0  3763058     item1, item2, item3
1  3763077  item_4, item_5, item_6

Then is possible use merge, especially if df1has more columns:

然后是可能的使用merge，特别是如果df1有更多的列：

df = pd.merge(df1, df2, on='ID', how='left')
print (df)
        ID  Name                     Tag
0  3763058  Andi     item1, item2, item3
1  3763077  Mark  item_4, item_5, item_6

Solution with map, if need add only one column:

用解决map，如果只需要添加一列：

df2 = df2.groupby('ID')['Tag'].apply(', '.join).reset_index()
df2['Name'] = df2['ID'].map(df1.set_index('ID')['Name'])
print (df2)
        ID                     Tag  Name
0  3763058     item1, item2, item3  Andi
1  3763077  item_4, item_5, item_6  Mark

If important position of Namecolumn use insert:

如果Name列的重要位置使用insert：

df2 = df2.groupby('ID')['Tag'].apply(', '.join).reset_index()
df2.insert(1, 'Name', df2['ID'].map(df1.set_index('ID')['Name']))
print (df2)
        ID  Name                     Tag
0  3763058  Andi     item1, item2, item3
1  3763077  Mark  item_4, item_5, item_6

pandas 合并熊猫列（一对多）

提问by Andi Maier

回答by jezrael

相关推荐

最近更新

标签

pandas 合并熊猫列（一对多）

提问by Andi Maier

回答by jezrael

相关推荐

使用 Python Pandas 读取制表符分隔的文件

pandas 如何修复 MatPlotLib 的 mpl_finance 包？

如何使用包含字符串的某些列在 Pandas DataFrame 上绘制平行坐标？

如果同一行存在于另一个数据框中，如何删除 Pandas 数据框中的行？

相关推荐

最近更新

标签