Python pandas：查找给定列的百分位统计信息

Question

提问by Edamame

I have a pandas data frame my_df, where I can find the mean(), median(), mode() of a given column:

我有一个 Pandas 数据框 my_df，我可以在其中找到给定列的 mean()、median()、mode()：

my_df['field_A'].mean()
my_df['field_A'].median()
my_df['field_A'].mode()

I am wondering is it possible to find more detailed stats such as 90 percentile? Thanks!

我想知道是否有可能找到更详细的统计数据，例如 90%？谢谢！

Answer 1

回答by stackoverflowuser2010

You can use the pandas.DataFrame.quantile()function, as shown below.

您可以使用pandas.DataFrame.quantile()函数，如下所示。

import pandas as pd
import random

A = [ random.randint(0,100) for i in range(10) ]
B = [ random.randint(0,100) for i in range(10) ]

df = pd.DataFrame({ 'field_A': A, 'field_B': B })
df
#    field_A  field_B
# 0       90       72
# 1       63       84
# 2       11       74
# 3       61       66
# 4       78       80
# 5       67       75
# 6       89       47
# 7       12       22
# 8       43        5
# 9       30       64

df.field_A.mean()   # Same as df['field_A'].mean()
# 54.399999999999999

df.field_A.median() 
# 62.0

# You can call `quantile(i)` to get the i'th quantile,
# where `i` should be a fractional number.

df.field_A.quantile(0.1) # 10th percentile
# 11.9

df.field_A.quantile(0.5) # same as median
# 62.0

df.field_A.quantile(0.9) # 90th percentile
# 89.10000000000001

Answer 2

回答by piRSquared

assume series s

假设系列 s

s = pd.Series(np.arange(100))

Get quantiles for [.1, .2, .3, .4, .5, .6, .7, .8, .9]

获取分位数 [.1, .2, .3, .4, .5, .6, .7, .8, .9]

s.quantile(np.linspace(.1, 1, 9, 0))

0.1     9.9
0.2    19.8
0.3    29.7
0.4    39.6
0.5    49.5
0.6    59.4
0.7    69.3
0.8    79.2
0.9    89.1
dtype: float64

OR

或者

s.quantile(np.linspace(.1, 1, 9, 0), 'lower')

0.1     9
0.2    19
0.3    29
0.4    39
0.5    49
0.6    59
0.7    69
0.8    79
0.9    89
dtype: int32

Answer 3

回答by Edamame

I figured out below would work:

我想出了下面的工作：

my_df.dropna().quantile([0.0, .9])

Python pandas：查找给定列的百分位统计信息

提问by Edamame

回答by stackoverflowuser2010

回答by piRSquared

回答by Edamame

相关推荐

最近更新

标签

Python pandas：查找给定列的百分位统计信息

提问by Edamame

回答by stackoverflowuser2010

回答by piRSquared

回答by Edamame

相关推荐

Python 为什么我收到错误：没有名为“email.MIMEMultipart”的模块？

Python 用参数最小化函数

Python 如何选择最后一行以及如何通过索引访问 PySpark 数据帧？

单击 find_element_by_class_name 按钮不起作用 python selenium webdriver 不起作用

相关推荐

最近更新

标签