把一个列表中含有某些相同字符的元素分成一组

aggopie · 发表于 2018-9-19 09:38:37

本帖最后由 aggopie 于 2018-9-19 09:41 编辑

["SHFE.al", "SHFE.cu", "SHFE.zn",
"CZCE.SR","CZCE.CF","CZCE.CY","CZCE.ZC",
"DCE.m","DCE.y","DCE.a","DCE.b","DCE.p"
"CFFEX.IF","CFFEX.IH","CFFEX.IC","CFFEX.TS",
"INE.sc"]

怎样把上面这样的列表中有某些相同字符分别划分到一个列表，比如把带有SHFE的分为一个列表，CZCE的分为一个列表，DCE的分为一个列表,但是有某些相同字符有时候有不确定是哪些，比如有时候会有SHFE，CZCE，有时候会是其他的，比如INE，off等

ssaxi · 发表于 2018-10-6 09:04:45

显然是用正则表达式了。

sheeboard · 发表于 2018-9-19 19:49:18

用pandas
内建itertools里的groupby也可以，自己去研究一下

import pandas as pd
a=["SHFE.al", "SHFE.cu", "SHFE.zn",
  "CZCE.SR","CZCE.CF","CZCE.CY","CZCE.ZC",
"DCE.m","DCE.y","DCE.a","DCE.b","DCE.p",
"CFFEX.IF","CFFEX.IH","CFFEX.IC","CFFEX.TS",
   "INE.sc"]
df=pd.DataFrame(a,columns=['a'])
df['temp']=df['a'].apply(lambda x: x.split('.')[0])
grouped=df.groupby('temp')['a']
for i,data in grouped:
   print(list(data))

aggopie · 发表于 2018-9-23 14:14:11

多谢，多谢

艾幻翔 · 发表于 2018-11-21 17:37:08

献丑

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# Created by lightwave on 2017/9/6
# Copyright (c) 2017 lightwave. All rights reserved.
from collecti** import defaultdict
temp_list = ["SHFE.al", "SHFE.cu", "SHFE.zn",
"CZCE.SR", "CZCE.CF", "CZCE.CY", "CZCE.ZC",
"DCE.m", "DCE.y", "DCE.a", "DCE.b", "DCE.p",
"CFFEX.IF", "CFFEX.IH", "CFFEX.IC", "CFFEX.TS",
"INE.sc"]
key_func = lambda x: x.split(".")[0]
result_dict = defaultdict(list)
for item in temp_list:
key = key_func(item)
result_dict[key].append(item)
print(result_dict.values())

复制代码

group_by有个缺点是相同的内容必须是连续的或者说是排过序的

aggopie · 发表于 2018-12-10 15:54:15

艾幻翔发表于 2018-11-21 17:37
献丑

多多学习了

傻眼貓咪 · 发表于 2021-8-7 16:01:33

myList = [
'SHFE.al', 'SHFE.cu', 'SHFE.zn',
'CZCE.SR', 'CZCE.CF', 'CZCE.CY',
'CZCE.ZC', 'DCE.m', 'DCE.y',
'DCE.a', 'DCE.b', 'DCE.p',
'CFFEX.IF', 'CFFEX.IH', 'CFFEX.IC',
'CFFEX.TS', 'INE.sc'
]
def array(data: list) -> list:
category = []
mySet = set()
final = []
for i in data:
a, b = i.split('.')
category.append((a, b))
mySet.add(a)
for i in mySet:
a = []
for j in category:
if j[0] == i:
a.append('.'.join(j))
final.append(a)
return final
print(array(myList))

复制代码

		自动登录	找回密码
密码			立即注册

[求助] 把一个列表中含有某些相同字符的元素分成一组