查找某一时间段内的文件内容并输出到文件

南城IT小工 2013-11-04 04:38:03

现有目录下大量文件，文件格式如下：
[2013-11-4 16:00:00]aa
[2013-11-4 17:00:00]bb
[2013-11-4 18:00:00]cc
如何用脚本找出每个文件中16:00:00-18:00:00之间的文件内容并输出到新文件？

...全文

333 11 打赏收藏转发到动态举报

写回复

用AI写文章

11 条回复

切换为时间正序

请发表友善的回复…

发表回复

ceclinux 2013-11-05

打赏
举报

引用 4 楼 magi1201 的回复:

[quote=引用 3 楼 Cecil_911 的回复:] 我看不出哪里不准确了，漏了什么

hadoop3@linux-240:~> cat time.txt
[2013-11-4 16:00:00]aa
[2013-11-4 20:00:00]aa
[2013-11-4 17:00:00]bb
[2013-11-4 18:00:00]cc
[2013-11-4 19:00:00]aa
[2013-11-4 17:00:00]bb
[2013-11-4 18:00:00]cc
hadoop3@linux-240:~> sed -n '/16:00:00/,/18:00:00/p' time.txt
[2013-11-4 16:00:00]aa
[2013-11-4 20:00:00]aa
[2013-11-4 17:00:00]bb
[2013-11-4 18:00:00]cc

如果数据不规整的话，那截取的值就不准确了[/quote] 这。。不符合科学道理啊，时间都会乱序

南城IT小工 2013-11-05

打赏
举报

请问用awk如何处理呢？不规整数据的处理问题我也发现了，我的一个思路是：如果非要用sed，需要事先对处理的数据排序。

ljc007 2013-11-05

打赏
举报

引用 6 楼 magi1201 的回复:

我想跟着探讨下，如果出现这种格式的数据，该如何处理，仅从技术角度。当然，实际应用中可能很少产生上述格式的数据。

这种情况需要逐行读取然后判断时间，用awk比较方便。另外常见的做法就是先排序再处理。但是遇到非常巨大的文件，处理速度会很慢。

姜小白- 2013-11-05

打赏
举报

引用 5 楼 ljc007 的回复:

在实际工作中，哪个软件会产生这样的日志？

我想跟着探讨下，如果出现这种格式的数据，该如何处理，仅从技术角度。当然，实际应用中可能很少产生上述格式的数据。

ljc007 2013-11-05

打赏
举报

引用 4 楼 magi1201 的回复:

如果数据不规整的话，那截取的值就不准确了

在实际工作中，哪个软件会产生这样的日志？

姜小白- 2013-11-05

打赏
举报

引用 3 楼 Cecil_911 的回复:

我看不出哪里不准确了，漏了什么

hadoop3@linux-240:~> cat time.txt
[2013-11-4 16:00:00]aa
[2013-11-4 20:00:00]aa
[2013-11-4 17:00:00]bb
[2013-11-4 18:00:00]cc
[2013-11-4 19:00:00]aa
[2013-11-4 17:00:00]bb
[2013-11-4 18:00:00]cc
hadoop3@linux-240:~> sed -n '/16:00:00/,/18:00:00/p' time.txt
[2013-11-4 16:00:00]aa
[2013-11-4 20:00:00]aa
[2013-11-4 17:00:00]bb
[2013-11-4 18:00:00]cc

如果数据不规整的话，那截取的值就不准确了

linux-c 2013-11-05

打赏
举报

引用 10 楼 ljc007 的回复:

[quote=引用 8 楼 orient0001 的回复:] 请问用awk如何处理呢？不规整数据的处理问题我也发现了，我的一个思路是：如果非要用sed，需要事先对处理的数据排序。

[root]# cat urfile [2013-11-4 16:00:00]aa [2013-11-4 20:00:00]aa [2013-11-4 17:00:00]bb [2013-11-4 18:00:00]cc [2013-11-4 19:00:00]aa [2013-11-4 17:00:00]bb [2013-11-4 18:00:00]cc [root]# awk 'BEGIN{FS=OFS="[][]+"}{if($2>="2013-11-4 16:00:00")if($2<="2013-11-4 18:00:00")print}' urfile [2013-11-4 16:00:00]aa [2013-11-4 17:00:00]bb [2013-11-4 18:00:00]cc [2013-11-4 17:00:00]bb [2013-11-4 18:00:00]cc[/quote]

引用 10 楼 ljc007 的回复: