找回密码
 立即注册

扫一扫,访问微社区

QQ登录

只需一步,快速开始

查看: 1795|回复: 1

[求助] 【pandas实例求助】 关于多个表按条件筛选的问题

0

主题

0

帖子

0

积分

贫民

积分
0
a836669648 发表于 2019-10-31 15:59:02 | 显示全部楼层 |阅读模式
本帖最后由 a836669648 于 2019-10-31 16:00 编辑

有关于公交车信息的两个表,一个是公交表,里面放了公交车的ID,站点ID,还有到站时间,离站时间;另一个是乘客表,保存了乘客刷卡时的公交ID,还有刷卡时间。需求是:两个表的公交ID相同,然后乘客的刷卡时间在车的到离站时间范围内,判断出乘客在哪里上的车,并把站点写在乘客表里面。

目前我的想法是定义一个函数,功能是判断两个表的公交ID和时间。然后在乘客表中调用apply方法,对每一行数据进行判断。这个方法即使用了多进程也需要六个小时的时间,我一直觉得是我没有找对方法,所以想请教一下各位pandas大佬有没有什么办法能高效、快速的完成这个需求。
  1. 这个是筛选的函数
复制代码


ps:每个表中BUSID是大量重复的,但是时间都不一样。(同一辆车有多个到站离站时间,同一辆车有多个用户刷卡上车)
回复

使用道具 举报

0

主题

956

帖子

956

积分

圣骑士

积分
956
sheeboard 发表于 2019-11-4 08:38:46 | 显示全部楼层
给个测试数据吧。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表