如何在DataFrame数据以一列为关键字分组，并选取所有组前N....

xyzxz · 发表于 2021-2-4 16:56:41

sheeboard 发表于 2021-2-3 20:49
运行环境还是换主流一点的版本，去下个anaconda，方便一点。temp1 = temp.sort_values('总分', ascending=F ...

非常感谢，你的帮助。换python3.8后，还报同样的警告信息，生成文件是空的。这个是我电话，13838312737，您看方便联系吗？（冒昧了）

xyzxz · 发表于 2021-2-4 17:28:34

xyzxz 发表于 2021-2-4 16:56
非常感谢，你的帮助。换python3.8后，还报同样的警告信息，生成文件是空的。这个是我电话，13838312737， ...

如果用df.loc,我改为这样：temp=df1.loc[df1['学校']==school_name]，还是不行

sheeboard · 发表于 2021-2-4 17:55:11

本帖最后由 sheeboard 于 2021-2-4 17:57 编辑

把要做的文件发给我吧，我来做。文件太大的话发网盘。

xyzxz · 发表于 2021-2-5 15:32:23

sheeboard 发表于 2021-2-4 17:55
把要做的文件发给我吧，我来做。文件太大的话发网盘。

好的，那您帮我做吧，文件不超过5M。您加我微信吧。（13838312737）

bulebird09 · 发表于 2021-2-7 23:56:58

import pandas as pd

df1 = pd.read_excel('测试数据.xlsx')
df2 = pd.read_excel('每个学校取的人数.xlsx')
df1.sort_values(by=['学校', '总分'], ascending=False)

result = pd.DataFrame()

for ind, data in df2.iterrows():
school_name = data['学校']
num = data['人数']
temp = df1[df1['学校'] == school_name]
result = pd.concat([result, temp.head(num)])

result.to_excel('result.xlsx', index=False)

caiqingguo · 发表于 2021-2-8 23:01:05

跪请高手出手！

senlan · 发表于 2021-2-18 20:31:04

import pandas as pd
df1=pd.read_excel('测试数据.xlsx')
df2=pd.read_excel('每个学校取的人数.xlsx')
def judge(x):
for i in range(len(df2)):
if df2.loc[i,"学校"]== x.name:
return x[:df2.loc[i,'人数']]
df=df1.groupby("学校").apply(judge)
df=df.reset_index(drop=True)
df.sort_values(by='总分',ascending=False,inplace=True)
df.to_excel("结果.xlsx",index=False)

		自动登录	找回密码
密码			立即注册

[求助] 如何在DataFrame数据以一列为关键字分组，并选取所有组前N....