找回密码
 立即注册

扫一扫,访问微社区

QQ登录

只需一步,快速开始

查看: 4660|回复: 7

[求助] 一个文件有4个列,根据不同条件做统计

1

主题

3

帖子

3

积分

贫民

积分
3
showusmile 发表于 2017-6-25 21:48:34 | 显示全部楼层 |阅读模式
刚开始学python 本来用hive处理蛮简单的问题 用python好麻烦啊
有时间,小区,区域,电话号码   
按照天对时间,小区,区域 统计号码出现的个数  用啥函数或者方法啊?
回复

使用道具 举报

0

主题

20

帖子

20

积分

贫民

积分
20
zxy 发表于 2017-6-26 09:32:29 | 显示全部楼层
给出示例数据和想要的结果!
回复 支持 反对

使用道具 举报

1

主题

3

帖子

3

积分

贫民

积分
3
showusmile  楼主| 发表于 2017-6-26 09:50:53 | 显示全部楼层
zxy 发表于 2017-6-26 09:32
给出示例数据和想要的结果!

20170626|龙港小区|龙港支局|153XXXXX
20170626|龙港小区|龙港支局|153XXXXX
20170621|马屿小区|城关支局|153XXXXX
20170620|城关小区|城关支局|153XXXXX

想要统计成
20170626|龙港小区|龙港支局|153XXXXX    2
20170621|马屿小区|城关支局|153XXXXX    1
20170620|城关小区|城关支局|153XXXXX    1
回复 支持 反对

使用道具 举报

1

主题

3

帖子

3

积分

贫民

积分
3
showusmile  楼主| 发表于 2017-6-26 09:51:01 | 显示全部楼层
zxy 发表于 2017-6-26 09:32
给出示例数据和想要的结果!

20170626|龙港小区|龙港支局|153XXXXX
20170626|龙港小区|龙港支局|153XXXXX
20170621|马屿小区|城关支局|153XXXXX
20170620|城关小区|城关支局|153XXXXX

想要统计成
20170626|龙港小区|龙港支局|153XXXXX    2
20170621|马屿小区|城关支局|153XXXXX    1
20170620|城关小区|城关支局|153XXXXX    1
回复 支持 反对

使用道具 举报

0

主题

20

帖子

20

积分

贫民

积分
20
zxy 发表于 2017-6-26 12:24:16 | 显示全部楼层
with open('file.txt') as f:
        for i in f:
               
                d.setdefault(i.replace('\n',''),0)
                d[i.replace('\n','')] += 1


for k,v in d.items():
        print k,v
回复 支持 反对

使用道具 举报

0

主题

20

帖子

20

积分

贫民

积分
20
zxy 发表于 2017-6-26 12:24:22 | 显示全部楼层
with open('file.txt') as f:
        for i in f:
               
                d.setdefault(i.replace('\n',''),0)
                d[i.replace('\n','')] += 1


for k,v in d.items():
        print k,v
回复 支持 反对

使用道具 举报

0

主题

25

帖子

25

积分

贫民

积分
25
zps26 发表于 2017-6-26 16:09:33 | 显示全部楼层
本帖最后由 zps26 于 2017-6-26 16:11 编辑
  1. import pandas as pd
  2. s=['20170626|龙港小区|龙港支局|153XXXXX','20170626|龙港小区|龙港支局|153XXXXX','20170621|马屿小区|城关支局|153XXXXX','20170620|城关小区|城关支局|153XXXXX']
  3. t=pd.DataFrame(s,columns=['testdata'])
  4. tcount=t['testdata'].value_counts()
  5. print(t,tcount,sep='\n')
复制代码
------------------------------------------------------------------------------------

                      testdata
0  20170626|龙港小区|龙港支局|153XXXXX
1  20170626|龙港小区|龙港支局|153XXXXX
2  20170621|马屿小区|城关支局|153XXXXX
3  20170620|城关小区|城关支局|153XXXXX

20170626|龙港小区|龙港支局|153XXXXX    2
20170621|马屿小区|城关支局|153XXXXX    1
20170620|城关小区|城关支局|153XXXXX    1
回复 支持 反对

使用道具 举报

3

主题

278

帖子

278

积分

侠客

积分
278

热心会员

uitb 发表于 2017-6-26 19:19:22 | 显示全部楼层
zxy 发表于 2017-6-26 12:24
with open('file.txt') as f:
        for i in f:
               

哈哈,又学到一个细节性的东西,dict.setdefault(k,v)  dictk[k] += 1 ,这两句处理类似问题还挺方便的
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表