pandas 熊猫数据框分组：仅正数的总和/计数

Question

提问by Alexis Eggermont

I have a dataframe ('frame') on which I want to aggregate by Country and Date:

我有一个数据框（'frame'），我想在上面按国家和日期聚合：

aggregated=pd.DataFrame(frame.groupby(['Country','Date']).CaseID.count())

aggregated["Total duration"]=frame.groupby(['Country','Date']).Hours.sum()

aggregated["Mean duration"]=frame.groupby(['Country','Date']).Hours.mean()

I want to compute the above figures (total duration, mean duration, etc.) only for the positive 'Hours' numbers in 'frame'. How can I do that?

我只想为“帧”中的正“小时”数字计算上述数字（总持续时间、平均持续时间等）。我怎样才能做到这一点？

Thanks!

谢谢！

Sample "frame"

示例“框架”

import pandas as pd
Line1 = {"Country": "USA", "Date":"01 jan", "Hours":4}
Line2 = {"Country": "USA", "Date":"01 jan", "Hours":3}
Line3 = {"Country": "USA", "Date":"01 jan", "Hours":-999}
Line4 = {"Country": "Japan", "Date":"01 jan", "Hours":3}
pd.DataFrame([Line1,Line2,Line3,Line4])

Answer 1

回答by alko

Not as elegant as above, but deals differently some corner cases. dfstands for framefrom original question.

不像上面那样优雅，但处理一些特殊情况。df代表frame来自原始问题。

>>> df.groupby(['Country','Date']).agg(lambda x: x[x>0].mean())
                Hours
Country Date
Japan   01 jan    3.0
USA     01 jan    3.5
>>> df.ix[3, 'Hours'] = -1
>>> df.groupby(['Country','Date']).agg(lambda x: x[x>0].mean())
                Hours
Country Date
Japan   01 jan    NaN
USA     01 jan    3.5

Answer 2

回答by kgu87

How about -

怎么样 -

frame[frame["Hours"] > 0].groupby(['Country','Date'])

pandas 熊猫数据框分组：仅正数的总和/计数

提问by Alexis Eggermont

回答by alko

回答by kgu87

相关推荐

最近更新

标签

pandas 熊猫数据框分组：仅正数的总和/计数

提问by Alexis Eggermont

回答by alko

回答by kgu87

相关推荐

PYODBC 到 Pandas - DataFrame 不工作 - 传递值的形状是 (x,y)，索引意味着 (w,z)

将多索引添加到 Pandas 数据帧并保持当前索引

pandas 提高熊猫（PyTables？）HDF5 表写入性能

pandas 熊猫数据框分组并获得第n行

相关推荐

最近更新

标签