pandas 在熊猫数据框中将一列拆分为具有特定名称的多列

Question

提问by Avinash Clinton

I have following dataframe:

我有以下数据框：

pri    sec
TOM    AB,CD,EF
Hyman   XY,YZ
HARRY  FG
NICK   KY,NY,SD,EF,FR

I need following output with column names as following(based on how many , separated fields exists in column 'sec'):

我需要以下带有列名的输出（基于列“秒”中存在多少个分隔字段）：

pri    sec             sec0  sec1  sec2  sec3 sec4
TOM    AB,CD,EF        AB    CD    EF    NaN  NaN
Hyman   XY,YZ           XY    YZ    NaN   NaN  NaN
HARRY  FG              FG    NaN   NaN   NaN  NaN
NICK   KY,NY,SD,EF,FR  KY    NY    SD    EF   ER

Can I get any suggestions?

我能得到任何建议吗？

Answer 1

回答by jezrael

Use join+ split+ add_prefix:

使用join+ split+ add_prefix：

df = df.join(df['sec'].str.split(',', expand=True).add_prefix('sec'))
print (df)
     pri             sec sec0  sec1  sec2  sec3  sec4
0    TOM        AB,CD,EF   AB    CD    EF  None  None
1   Hyman           XY,YZ   XY    YZ  None  None  None
2  HARRY              FG   FG  None  None  None  None
3   NICK  KY,NY,SD,EF,FR   KY    NY    SD    EF    FR

And if need NaNs add fillna:

如果需要NaN添加fillna：

df = df.join(df['sec'].str.split(',', expand=True).add_prefix('sec').fillna(np.nan))
print (df)
     pri             sec sec0 sec1 sec2 sec3 sec4
0    TOM        AB,CD,EF   AB   CD   EF  NaN  NaN
1   Hyman           XY,YZ   XY   YZ  NaN  NaN  NaN
2  HARRY              FG   FG  NaN  NaN  NaN  NaN
3   NICK  KY,NY,SD,EF,FR   KY   NY   SD   EF   FR

Answer 2

回答by rnso

Try following code (explanations as comments). It finds max length of items in "sec" column and creates names accordingly:

尝试以下代码（解释为注释）。它在“秒”列中找到项目的最大长度并相应地创建名称：

maxlen = max(list(map(lambda x: len(x.split(",")) ,df.sec))) # find max length in 'sec' column
cols = ["sec"+str(x)   for x in range(maxlen)]      # create new column names 
datalist = list(map(lambda x: x.split(","), df.sec)) # create list from entries in "sec" 
newdf = pd.DataFrame(data=datalist, columns=cols)   # create dataframe of new columns
newdf = pd.concat([df, newdf], axis=1)              # add it to original dataframe
print(newdf)

Output:

输出：

     pri             sec sec0  sec1  sec2  sec3  sec4
0    TOM        AB,CD,EF   AB    CD    EF  None  None
1   Hyman           XY,YZ   XY    YZ  None  None  None
2  HARRY              FG   FG  None  None  None  None
3   NICK  KY,NY,SD,EF,FR   KY    NY    SD    EF    FR

pandas 在熊猫数据框中将一列拆分为具有特定名称的多列

提问by Avinash Clinton

回答by jezrael

回答by rnso

相关推荐

最近更新

标签

pandas 在熊猫数据框中将一列拆分为具有特定名称的多列

提问by Avinash Clinton

回答by jezrael

回答by rnso

相关推荐

pandas 熊猫根据布尔条件选择行和列

pandas 按月份名称对熊猫的数据框系列进行排序？

Pandas 数据框到烧瓶模板作为 json

pandas 为什么 DBSCAN 聚类在电影镜头数据集上返回单个聚类？

相关推荐

最近更新

标签