unix编程难题,如何分解这样的文件

angel518 2009-06-06 06:38:38
有一些文件,文件A的内容可能如下:
北京#2||erif|23|yu||||||a|^|||$$$
文件B的内容可能如下:
黑白hg|er|nmd|2||||反对法||||||反对jdjf|$$$
等等。总之,文件内容以"|"进行字段分隔,两个“|”之间可以有内容,也可以为空(非空格);现在要求把这些文件按照字段分解到另外的文件中,新文件要求每个字段占据一行,遇到^符号则退出对该文件的处理,遇到$$$符号则表示处理到该文件的尾部。比如文件A处理结果为:(两个“|”之间为空也是一个字段,处理后占一行)
================================
北京#2

erif
23
yu





a
==============================
不用一个一个字符读取,如何快速的达到偶的要求呢因为是从文件到文件转换,要求效率,用fgetc好像不合适吧???同样,如果一个一个字符处理,遇到中文怎么办呢,需要进行扫描转换吗????)
用strtok函数,对两个“|”之间为空的部分不会返回一个空,而是接着处理后面的,直到有数据为止才返回
比如对文件A用strstok后会返回:

================================
北京#2
erif
23
yu
a
==============================
文件有可能很长,后面的内容可能会循环,所以也不能固定几个字段,用sprintf来格式化处理

...全文
22 7 打赏 收藏 转发到动态 举报
写回复
用AI写文章
7 条回复
切换为时间正序
请发表友善的回复…
发表回复
mymtom 2009-06-08
  • 打赏
  • 举报
回复
好奇怪!!!
mymtom 2009-06-07
  • 打赏
  • 举报
回复
[Quote=引用 4 楼 threeleafzerg007 的回复:]
有明显 "|" 分隔符的话 为啥不用 awk脚本捏
[/Quote]

#!/usr/bin/nawk -f

BEGIN {
FS = "|"
}

0 == 0 {
for ( count = 1; count <= NF; count++) {
if (($count == "$$$") || ($count == "^"))
break
print $count
}
}
unixlinuxsys 2009-06-07
  • 打赏
  • 举报
回复
awk
sed
threeleafzerg007 2009-06-06
  • 打赏
  • 举报
回复
有明显 "|" 分隔符的话 为啥不用 awk脚本捏
mymtom 2009-06-06
  • 打赏
  • 举报
回复
有个小BUG

#include <stdio.h>
#include <string.h>

#define BUFLEN 1024

static int filter(char *str);

int
main(void)
{
char buf[BUFLEN + 1];

strcpy(buf, "北京#2||erif|23|yu||||||a|^|||$$$");
printf("%s\n", buf);
filter(buf);
printf("%s\n", buf);

strcpy(buf, "黑白hg|er|nmd|2||||反对法||||||反对jdjf|$$$");
printf("%s\n", buf);
filter(buf);
printf("%s\n", buf);

return (0);
}

static int
filter(char *str)
{
char *p, *q;

p = strstr(str, "$$$");
q = strstr(str, "^");

if (p != NULL)
*p = 0;
if (q != NULL)
*q = 0;

for (p = str; *p; p++)
if (*p == '|')
*p = '\n';

return (0);
}
mymtom 2009-06-06
  • 打赏
  • 举报
回复

$ cat love.c && make love && ./love
#include <stdio.h>
#include <string.h>

#define BUFLEN 1024

static int filter(char *str);

int
main(void)
{
char buf[BUFLEN + 1];

strcpy(buf, "北京#2||erif|23|yu||||||a|^|||$$$");
printf("%s\n", buf);
filter(buf);
printf("%s\n", buf);

strcpy(buf, "黑白hg|er|nmd|2||||反对法||||||反对jdjf|$$$");
printf("%s\n", buf);
filter(buf);
printf("%s\n", buf);

return (0);
}

static int
filter(char *str)
{
char *p, *q;

p = strstr(str, "$$$");
q = strstr(str, "^");

if (p != NULL)
*p = 0;
if (q != NULL)
*p = 0;

for (p = str; *p; p++)
if (*p == '|')
*p = '\n';

return (0);
}
cc love.c -o love
北京#2||erif|23|yu||||||a|^|||$$$
北京#2

erif
23
yu





a
^



黑白hg|er|nmd|2||||反对法||||||反对jdjf|$$$
黑白hg
er
nmd
2



反对法





反对jdjf

$
angel518 2009-06-06
  • 打赏
  • 举报
回复
偶曾经试着用strtok来处理,结果如上所述,分解的结果不满足要求,怎么办呢

23,117

社区成员

发帖
与我相关
我的任务
社区描述
Linux/Unix社区 应用程序开发区
社区管理员
  • 应用程序开发区社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧