|
| ID | PD | Type | Deadline | Type_ID | 0 | 1 | 2 | test | 2015-05-18 | 1 | 1 | 1 | 3 | test | 2020-05-18 | 1 | 2 | 331 | 1 | test | 2019-05-18 | 1 |
想根据ID groupby之后选取Dealine最大的日期的。
代码为:
Task1=pd.DataFrame(result)
def get_largest_date(x):
df = x.sort_values(by="Deadline",ascending=True)
return df.iloc[-1,:]
Task=Task1.groupby('ID').agg({'PD':'sum','Type_ID':'max'}).apply(get_largest_date)
返回如下错误信息
TypeError: sort_values() got an unexpected keyword argument 'by'
是因为这里的Dealine无法进行排序或者比较么?因为我用 Task=Task1.groupby('ID').agg({'PD':'sum','Deadline':'max','Type_ID':'max'})也不行。
求高手指点迷津。
先谢过了~~
|
|