【awk】数组排序

LeonTown 2011-08-03 02:50:25
该awk应用的需求是:

awk脚本文件的输入是一个文件路径,
遍历该文件的各行,提取出信息,记录在一个数组里。

该信息可以认为是一个key-value的形式,
然后,根据key进行排序,
最后将排好序的数组输出。

请问这样的awk脚本该如何写呢?
主要是key-value数组的存储,和排序,及按序输出。

谢谢!!
...全文
389 12 打赏 收藏 转发到动态 举报
写回复
用AI写文章
12 条回复
切换为时间正序
请发表友善的回复…
发表回复
LeonTown 2011-08-04
  • 打赏
  • 举报
回复
再就是,增加该行的x的数量这个字段,
因为,x的数量肯呢个很多,用眼数不过来。。。

[Quote=引用 11 楼 leontown 的回复:]

cnt=0;这一句不可以放在BEGIN段里吗?

不是说,awk脚本只是对一行进行处理吗?
放在BEGIN段里应该不会有影响吧?

另外,为什么要用asorti啊?


再就是,能不能给数组的内容再增加一些字段,比如当前文件名等?
[/Quote]
LeonTown 2011-08-04
  • 打赏
  • 举报
回复
cnt=0;这一句不可以放在BEGIN段里吗?

不是说,awk脚本只是对一行进行处理吗?
放在BEGIN段里应该不会有影响吧?

另外,为什么要用asorti啊?


再就是,能不能给数组的内容再增加一些字段,比如当前文件名等?
delphiwcdj 2011-08-04
  • 打赏
  • 举报
回复



# test.awk

BEGIN{
#myarray[-1]=ARGV[1];# awk -f test.awk data
#print myarray[-1]; # print data
}
{
cnt=0;
for(i=0; i<NF; ++i){
# debug
# printf("%c ",$(i+1));
if($(i+1)=="x"){
++cnt;
}
}
#printf("\n");
myarray[cnt]=$0;
}
END{
n=asorti(myarray, dest);# asorti(gawk3.1.2)
for(i=1; i<=n; ++i){
print myarray[dest[i]]; #print value of array
}
#for(i=0; i<=NF; ++i){
# if(myarray[i]){
# print myarray[i];
# }
#}
}

delphiwcdj 2011-08-03
  • 打赏
  • 举报
回复
修改下

# test.awk

#BEGIN{
# myarray[-1]=ARGV[1];# awk -f test.awk data
# print myarray[-1]; # print data
#}
{
cnt=0;
for(i=0; i<NF; ++i){
# debug
# printf("%c ",$(i+1));
if($(i+1)=="x"){
++cnt;
}
}
#printf("\n");
myarray[cnt]=$0;
}
END{
#n=asorti(myarray);# asorti(gawk3.1.2)
#for(i=1; i<=n; ++i){
# print myarray[i]; #print value of array
#}
for(i=0; i<=NF; ++i){
if(myarray[i]){
print myarray[i];
}
}
}

测试:data.txt
a b x c d
b x c x x
c x x d v

awk -f test.awk data

输出:
a b x c d
c x x d v
b x c x x
LeonTown 2011-08-03
  • 打赏
  • 举报
回复
[Quote=引用 7 楼 delphiwcdj 的回复:]

gawk -f test.awk data

data文件:
a b x c d
x a c x x
c x x d v
输出:
a b x c d
c x x d v
x a c x x
Perl code

# test.awk
BEGIN{
cnt=0;
}
{
for(i=0; i<NF; ++i){
# printf("%c ",$(……
[/Quote]

非常感谢!

有没有可能给数组增加一个当前文件名(data)的字段呢?
delphiwcdj 2011-08-03
  • 打赏
  • 举报
回复
gawk -f test.awk data

data文件:
a b x c d
x a c x x
c x x d v
输出:
a b x c d
c x x d v
x a c x x

# test.awk
BEGIN{
cnt=0;
}
{
for(i=0; i<NF; ++i){
# printf("%c ",$(i+1));
if($(i+1)=="x"){
++cnt;
}
}
#printf("\n");
myarray[$cnt]=$0;
}
END{
n=asort(myarray);
for(i=1; i<=n; ++i){
print myarray[i];
}
}

LeonTown 2011-08-03
  • 打赏
  • 举报
回复
[Quote=引用 5 楼 joan8363 的回复:]

key是当前行中"x"的数量,value记录行号等信息。

key是x的数量?这样key不就不唯一了?
[/Quote]

哦,这个数组不能认为就是个map,
这里的key仅供排序之用。

或许,数组存储的是一个struct,其中有x的数量、行号等信息,
并且,根据x的数量排序。
joan8363 2011-08-03
  • 打赏
  • 举报
回复
key是当前行中"x"的数量,value记录行号等信息。

key是x的数量?这样key不就不唯一了?
LeonTown 2011-08-03
  • 打赏
  • 举报
回复
[Quote=引用 3 楼 joan8363 的回复:]

awk -F'x' '{print NF-1,$0}' | sort -n
[/Quote]

这是个很有趣的技巧!
不过,我更希望通过遍历字段,将结果备份到数组里,
还要记录当前的行号,文件名等信息。

类似于:
for (x=1; x<=NF; x++) {
if($x == "x")
num_null = num_null + 1
}


主要是,这里的数组该如何表示呢?
key是当前行中"x"的数量,value记录行号等信息。
并且按照key对数组进行排序。
joan8363 2011-08-03
  • 打赏
  • 举报
回复
awk -F'x' '{print NF-1,$0}' | sort -n
LeonTown 2011-08-03
  • 打赏
  • 举报
回复
比如说,文件格式如下:
a b x c d
x a c d a
c x x d v
...

每行有5个字段,统计每行出现x的次数,
并根据x的数量从小到大重拍各行。
joan8363 2011-08-03
  • 打赏
  • 举报
回复
搞个例子出来比较好
awk '{a[$1]=$2}END{l=asorti(a,b);for(i=1;i<=l;i++)print b[i],a[b[i]]}'
内容概要:本文围绕“非线性流量的数据驱动Koopman模型预测控制研究”展开,提出一种基于数据驱动的Koopman算子理论方法,用于构建非线性系统的线性化状态空间模型,并结合模型预测控制(MPC)实现对复杂非线性系统的高效控制。研究通过引入扩展动态模态分解(EDMD)等观测函数,将非线性动力学映射至高维特征空间,在该空间中实现近似线性化表征,进而融合线性MPC框架进行优化求解。全文系统阐述了Koopman算子的数学基础、隐式线性化机制及在非线性流量控制中的建模流程,并通过Matlab代码完成了算法实现与仿真实验,验证了该方法在处理无精确物理模型、强非线性、时变动态系统中的有效性与鲁棒性,尤其适用于工业流程控制、能源系统调度等实际工程场景。; 适合人群:具备自动控制理论、非线性系统分析基础,熟悉Matlab编程,从事控制工程、系统辨识、智能优化、能源系统建模等方向的研究生、科研人员及工程技术人员。; 使用场景及目标:①应用于难以建立精确数学模型的复杂非线性系统(如流体动力系统、电力电子系统、机器人动力学等)的建模与实时控制;②实现数据驱动下的模型预测控制,提升系统响应速度与控制精度;③为先进控制策略(如MPC)提供一种可行的线性化建模范式,推动现代控制理论与数据科学、机器学习的深度融合。; 阅读建议:建议读者结合提供的Matlab代码深入理解Koopman方法的具体实现过程,重点关注观测函数构造、核函数选择、矩阵逼近、降维处理及MPC控制器设计等关键技术环节,并尝试将其迁移至其他非线性系统中进行复现实验与性能对比,以全面掌握其适用范围与局限性。
内容概要:本文详细介绍了一种基于Simulink的光伏储能单相逆变器并网仿真模型,系统涵盖了光伏阵列、储能单元、DC-AC单相逆变器及并网接口的完整结构,重点实现了储能环节的能量管理与逆变器并网控制策略的建模仿真。通过Simulink平台构建系统模型,验证了逆变器输出电能质量、并网稳定性以及控制系统的动态响应性能,采用SPWM调制、PI闭环控制等关键技术,确保并网电流与电网电压同频同相,满足并网电能质量要求。该模型不仅可用于分布式能源系统的仿真研究,还可作为新能源并网技术的教学与工程实践工具。; 适合人群:电气工程、自动化、新能源科学与工程等相关专业的高校本科生、研究生、科研人员,以及从事光伏发电系统设计、储能控制与并网技术研发的工程技术人员。; 使用场景及目标:①深入理解光伏储能系统中能量转换、存储与并网控制的整体工作原理;②支持课程设计、毕业设计或科研项目中对单相逆变器控制策略(如SPWM、PI调节、锁相技术等)的仿真验证与参数优化;③为后续研究更复杂的控制算法(如MPPT、低电压穿越、谐波抑制等)提供可扩展的仿真基础平台。; 阅读建议:建议结合MATLAB/Simulink环境动手搭建与调试模型,逐步理解各模块(如光伏建模、储能充放电控制、逆变器驱动、锁相环、PI调节器等)的功能与交互关系,重点关注控制系统的设计逻辑与参数整定过程,并可通过修改负载条件或电网参数测试系统鲁棒性,为进一步拓展至三相系统或多机并网场景奠定基础。

23,223

社区成员

发帖
与我相关
我的任务
社区描述
Linux/Unix社区 应用程序开发区
社区管理员
  • 应用程序开发区社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧