求教用awk脚本如何统计不重复的行数

selfnature 2014-12-17 04:12:30

做广播网络仿真，统计非重复的收包个数
数据格式如下：
pid nid send_time receive_time
0 5 XXX XXX
0 2 XXX XXX
10 4 XXX XXX
11 4 XXX XXX
12 4 XXX XXX
10 4 XXX XXX
我现在用的脚本如下：
awk '$1!=0{pid_r[$1]=$1' END{for (i in pid_r) RecvSum++}{print RecvSum}' $*
总是算出0个RecvSum，郁闷

求教个有效的脚本，要求：不改变源数据文件，只用关联数组记录中间处理结果，最后的输出是基于关联数组的统计。
另问：awk有计算关联数组的长度的函数吗？

...全文

1053 2 打赏收藏转发到动态举报

写回复

2 条回复

切换为时间正序

请发表友善的回复…

发表回复

ljc007 2014-12-18

打赏
举报

回复

[root]# cat a.txt pid nid send_time receive_time 0 5 XXX XXX 0 2 XXX XXX 10 4 XXX XXX 11 4 XXX XXX 12 4 XXX XXX 10 4 XXX XXX [root]# awk 'NR>1{if($1)n++}END{print n}' a.txt 4

pangubing 2014-12-17

打赏
举报

回复

awk 'BEGIN {count=0;revsum=0;} {if($1!=0){pid[count++]=$1};} END{for(i=0;i<count;i++){ print i" "pid[i]}; print "rvcsum:" count}' pid（数据文件）这样是你想要的吗？

获取单个文件行数文件：test1.sh 行数：20 方法一代码如下: awk ‘{print NR}’ test1.sh|tail -n1 如图所示：方法二代码如下: awk ‘END{print NR}’ test1.sh 如图所示：方法三代码如下: grep -n “” test1.sh|awk -F: ‘{print ‘}|tail -n1 如图所示：方法四代码如下: sed -n ‘$=’ test1.sh 如图所示：方法五代码如下: wc -l test1.sh 如图所示：方法六代码如下: #cat test1.sh |wc -l 如图所

# 统计第4列为0112并且第5列为00或者03的行数 awk -F '|' '{if(($4=="0112")&&($5=="00"||$5=="03")) print $1}' epcc0303_20210423.txt|wc -l # 去重展示第一列的时间 awk -F '|' '{print $1}' epcc0303_20210422.txt|sort|uniq

课程从零开始、零基础学Linux运维脚本开发、课程内容包含了与shell脚本开发相关的所有内容；如分支、循环、交互式、批量部署(免密、应用、服务器)、数值、进制、字符串、awk、重定向、信号操作等的深入使用；脚本实战编程思路、企业环境脚本架构及解决思路，掌握解决问题及开发脚本解决问题的方法，最重要的是学到了技术要拿出来用，而不是简单的学个技术，一定要实用，能够自己写脚本。独立写出有质量的脚本！

使用hdfs dfs -cat /prod/brand=xxx/*|awk -F "," '{print $4}' 可查看逗号分隔的第四个字段，如果想要统计该字段各值出现的次数，可以使用以下命令 hdfs dfs -cat /prod/brand=xxx/*|awk -F “,” ‘{count[$4]++;} END {for(i in count) {print i count[i]}}’ 命令可分解为两部分 1、{count[$4]++;} END #声明数组（数组名字可随便起，叫arr、li

awk 统计文件中满足特定条件的行数例文件tt.txt sdfasf,I,55,56,asdfadf223 sdfasf,I,55,56,asdfadf2230k 1313,I,55,56,asdfad xvxzv,I,55,56,asdf adfa,a,d,afasd vafasf,fff,aw,aaa fasf,a,55,56,asdf asdcc,I,55,fasd

2,161

社区成员

4,355

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章