Pandas 在Python中创建空DataFrame

时间:2020-02-23 14:42:05  来源:igfitidea点击:

在本教程中,我们将看到如何使用Pandas库在Python中创建空数据标记。
假设我们想要仅创建空的DataFrame,并稍后将数据放入其中。
让我们看看如何以不同的方式创建空DataFrame。 DataFrame表格数据结构类似于电子表格。
它包含有序集合列,每列都有与其关联的数据类型。

dataframe类提供了构造函数,用于使用多个选项创建DataFrame。

def __init__(self, data=None, index=None, columns=None, dtype=None)

其中 data:它可以是任何ndarray,erreator或者另一个dataframe。 index:它可以是一个数组,如果不通过任何索引,那么索引将从0到行数-1 columns:列用于定义任何列的名称 dtype:DTYPE用于强制任何列的数据类型。
如果未指定DType,则从数据本身计算DTYPE。

创建空的dataframe.

如果我们只想创建空的DataFrame,我们只需使用pd.datafame()即可。

这是一个例子:

# import pandas library
import pandas as pd
 
#create empty DataFrame
 
first_df=pd.DataFrame()
 
print(first_df)

输出:

空DataFrame列:[]索引:[]

将数据添加到空的dataframe

我们可以将数据追加到空的DataFrame:

# import pandas library
import pandas as pd
 
#create empty DataFrame
 
emp_df=pd.DataFrame()
 
emp_df['Name']=['Mohan','Aryan','Neha']
emp_df['age']=[23,41,24]
emp_df['Gender']=['Male','Male','Female']
 
print(emp_df)

输出:

Name  age  Gender
0  Mohan   23    Male
1  Aryan   41    Male
2   Neha   24  Female

使用列创建空DataFrame

如果还知道DataFrame的列但没有任何数据,则可以使用列名和无数据创建DataFrame。
让我们看看如何做到这一点。

# import pandas library
import pandas as pd
 
#create empty DataFrame
 
first_df=pd.DataFrame(columns = ['Name','Age','Gender'] )
 
print(first_df)

输出:

空的DataFrame列:[名称,年龄,性别]索引:[]

将数据与列添加到空的dataframe

我们可以将数据追加到包含列的列中的空DataFrame:

# import pandas library
import pandas as pd
 
#create empty DataFrame
 
emp_df=pd.DataFrame(columns = ['Name','Age','Gender'] )
 
emp_df=emp_df.append({'Name':'Mohan','Age':23,'Gender':'Male'},ignore_index=True)
emp_df=emp_df.append({'Name':'Aryan','Age':41,'Gender':'Male'},ignore_index=True)
emp_df=emp_df.append({'Name':'Neha','Age':24,'Gender':'Female'},ignore_index=True)
 
print(emp_df)

输出:

Name  age  Gender
0  Mohan   23    Male
1  Aryan   41    Male
2   Neha   24  Female

使用列和索引创建空的DataFrame

我们可以通过将索引添加到以下的行来扩展前面的示例:

# import pandas library
import pandas as pd
 
#create empty DataFrame
 
first_df=pd.DataFrame(columns = ['Name','Age','Gender'] ,index=['One','Two','Three'])
 
print(first_df)

输出:

Name  Age Gender
One    NaN  NaN    NaN
Two    NaN  NaN    NaN
Three  NaN  NaN    NaN

将数据与列和索引添加到空的DataFrame

我们可以使用现有索引添加带有空DataFrame的行:

# import pandas library
import pandas as pd
 
#create empty DataFrame
 
emp_df=pd.DataFrame(columns = ['Name','Age','Gender'] ,index=['One','Two','Three'])
 
# Add rows using indices
emp_df.loc['One'] = ['Mohan',23,'Male']
emp_df.loc['Two'] = ['Aryan',41,'Male']
emp_df.loc['Three'] = ['Neha',24,'Female']
 
# Print DataFrame
print(emp_df)

输出:

Name  age  Gender
0  Mohan   23    Male
1  Aryan   41    Male
2   Neha   24  Female

使用索引创建空的DataFrame

我们可以通过将索引添加到以下的行来扩展前面的示例:

# import pandas library
import pandas as pd
 
#create empty DataFrame
 
first_df=pd.DataFrame(index=['One','Two','Three'])
 
print(first_df)

输出:

Empty DataFrame
Columns: []
Index: [One, Two, Three]

将数据与索引添加到空的DataFrame

我们可以使用现有索引添加带有空DataFrame的行:

# import pandas library
import pandas as pd
 
#create empty DataFrame
emp_df=pd.DataFrame(index=['One','Two','Three'])
 
# Add rows using indices
emp_df['Name']=['Mohan','Aryan','Neha']
emp_df['age']=[23,41,24]
emp_df['Gender']=['Male','Male','Female']
 
# Print DataFrame
print(emp_df)

输出:

Name  age  Gender
One    Mohan   23    Male
Two    Aryan   41    Male
Three   Neha   24  Female