|
大家好,初次发帖,真心求助。- TimeID,Division
- 201603012940006232914,0018
- 201603012940015183580,0018
- 201603012940015187205,0018
复制代码 类似这样的一个csv文件,一共有两列,TimeID和Division
现在想得到这样的结果:左侧的TimeID相同的两行的Division,就记作一次共同出现,比如
- 201603012940000695821,0018
复制代码 和
- 201603012940000695821,0022
复制代码 这两列,左侧都是201603012940000695821,那么就输出一次
这样的结果,我现在希望能得到所有这样的结果,但是现在的进展上有了点麻烦。
- import csv
- import networkx as nx
- g = nx.DiGraph()
- data_csv = open('output.csv')
- csv_f = csv.reader(data_csv,delimiter=',')
- prev_TimeID = -1
- prev_Division = -1
- for row in csv_f:
- if row[0] == prev_TimeID:
- g.add_edge(prev_Division,row[1])
- prev_TimeID = row[0]
- prev_Division = row[1]
- print (g.edges())
复制代码 目前的代码是这样的,然而这样只能统计出相邻的两列中符合条件的项,想麻烦大家帮个忙,如何能够统计出所有的符合条件的项呢?
谢谢大家了!
|
|