如何在Pandas DataFrame中获取列的频率计数

时间:2020-02-23 14:42:04  来源:igfitidea点击:

在本教程中,我们将看到如何在Pandas DataFrame中获取列的频率计数。

有时,我们可能必须找到分类列的每个唯一值的计数。
我们可以使用 value_count()容易获得频率计数。 value_count()使用频率计数列的返回级别对象。

以下是将在下文示例中使用的示例员工数据:

NameAgeDepartment
Adam27HR
Reena22Sales
Mahesh33Tech
Supriya26HR
Aman34Tech
import pandas as pd
emp_df = pd.DataFrame({'Name': ['Adam','Reena','Mahesh','Supriya','Aman'], 
                        'Age': [27,22,33,26,34], 
                       'Department':['HR','Sales','Tech','HR','Tech']})
print("-------Original Dataframe-------\n",emp_df)
 
# Get unique values using unique() method
deptCounts = emp_df.Department.value_counts()
print("-------Frequency counts for Department column-------\n",deptCounts)
print(type(deptCounts))

输出:

-------Original Dataframe------
       Name  Age Department
0     Adam   27         HR
1    Reena   22      Sales
2   Mahesh   33       Tech
3  Supriya   26         HR
4     Aman   34       Tech
-------Frequency counts for Department column------
 HR       2
Tech     2
Sales    1
Name: Department, dtype: int64
<class 'pandas.core.series.Series'>

如我们所见,我们在列中的每个唯一值都有频率计数 Department