找回密码
 立即注册

扫一扫,访问微社区

QQ登录

只需一步,快速开始

查看: 2700|回复: 3

[求助] python 数据筛选

1

主题

3

帖子

3

积分

贫民

积分
3
wuzc 发表于 2018-8-30 11:15:51 | 显示全部楼层 |阅读模式
有这样一个列表:

L1 = ["SELECT A,B FROM T1 WHERE A = 'AAA' AND B=1 AND C<=TO_DATE('2018-08-30',YYYY-MM-DD)",
      "SELECT A,B FROM T1 WHERE A = 'BBB' AND B=2 AND C<=TO_DATE('2018-08-21',YYYY-MM-DD)",
      "SELECT A,B FROM T1 WHERE A = 'CCC' AND B=3 AND C<=TO_DATE('2018-08-10',YYYY-MM-DD)",
      "SELECT C,D FROM T2 WHERE C = 'JJJ' AND D=4 AND E>=TO_DATE('2018-07-30',YYYY-MM-DD)",
      "SELECT C,D FROM T2 WHERE C = 'KKK' AND D=5 AND E>=TO_DATE('2018-05-30',YYYY-MM-DD)"]

--需要将L1进行处理,类似的语句只保留一条,最终结果保留2条,类似如下:
L1 = ["SELECT A,B FROM T1 WHERE A = 'AAA' AND B=1 AND C<=TO_DATE('2018-08-30',YYYY-MM-DD)",
      "SELECT C,D FROM T2 WHERE C = 'JJJ' AND D=4 AND E>=TO_DATE('2018-07-30',YYYY-MM-DD)"]

跪求各位大神解答~~~~~


回复

使用道具 举报

1

主题

3

帖子

3

积分

贫民

积分
3
wuzc  楼主| 发表于 2018-9-5 20:55:01 | 显示全部楼层
求大神解答呀
回复 支持 反对

使用道具 举报

0

主题

4

帖子

4

积分

贫民

积分
4
lixxu 发表于 2018-9-6 08:23:36 | 显示全部楼层
简单点就是匹配前多少个字符, 复杂点就用相似度匹配.
L1 = ["SELECT A,B FROM T1 WHERE A = 'AAA' AND B=1 AND C<=TO_DATE('2018-08-30',YYYY-MM-DD)",
      "SELECT A,B FROM T1 WHERE A = 'BBB' AND B=2 AND C<=TO_DATE('2018-08-21',YYYY-MM-DD)",
      "SELECT A,B FROM T1 WHERE A = 'CCC' AND B=3 AND C<=TO_DATE('2018-08-10',YYYY-MM-DD)",
      "SELECT C,D FROM T2 WHERE C = 'JJJ' AND D=4 AND E>=TO_DATE('2018-07-30',YYYY-MM-DD)",
      "SELECT C,D FROM T2 WHERE C = 'KKK' AND D=5 AND E>=TO_DATE('2018-05-30',YYYY-MM-DD)"]
L2 = []
check_size = 20
checked = []
for s in L1:
    if not L2:
        L2.append(s)
        checked.append(s[:check_size])
        continue

    if s.startswith(tuple(checked)):
        continue

    L2.append(s)
    checked.append(s[:check_size])
回复 支持 反对

使用道具 举报

1

主题

3

帖子

3

积分

贫民

积分
3
wuzc  楼主| 发表于 2018-9-6 20:55:30 | 显示全部楼层
lixxu 发表于 2018-9-6 08:23
简单点就是匹配前多少个字符, 复杂点就用相似度匹配.
L1 = ["SELECT A,B FROM T1 WHERE A = 'AAA' AND B=1  ...

谢谢大神,可能我是要弄复杂点的相似度匹配,只匹配前多少个字符在我模拟的数据里面可以的,但我实际要处理的数据可能语句长短不一,所以估计无法满足需求哟
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表