本博文仅仅汇总博主需要的内容,因为博主十分懒惰,所以博文内容肯定不全。 参考链接:grouby使用方法
groupby分组
tt
= data
.groupby
('bodyType')
for i
,j
in tt
:
print(i
,j
)
分组+聚合
聚合之后,返回一个DataFrame。 使用方法1: agg(列表) 列表中每一个元素都是一个函数,该函数会作用于groupby之后的每个列。
tt
= data
.groupby
('bodyType').agg
([np
.mean
,min])
tt
使用方法2: agg(字典) 字典的key是每一个列的名称,字典的value是名称(列)所做的聚合操作。
tt
= data
.groupby
('bodyType').agg
({'brand':[min],'city':[np
.mean
]})
tt
分组+apply
返回一个series
tt
= data
.groupby
('bodyType').apply(lambda x
:x
['brand'].mean
() - x
['city'].mean
())
tt