如何开发一个高效率的统计脚本?高手进来!
是想做一个网站IP回访率统计的脚本
file1是每天网站访问日志,file2是一个ip库,需要统计file1中的ip是否在file2中出现过,file2大概有50万的记录。file1大概有20万条记录。下面是我的脚本
#!/bin/bash
#...
#前面略过一些脚本
#incount是回访的IP数,newcount是新的访问IP数
incount=0
newcount=0
#file1每行记录的第3列是待检索的ip
while read a1 a2 a3 a4
do
if grep "$a3" file2 > /dev/null >&1
then
incount=`expr $incount + 1`
else
newcount=`expr $newcount + 1`
fi
done < $file1
echo "incount=$incount"
echo "newcount=$newcount"
但是这个遍历的脚本效率很慢,是否有更好的方法,比如用awk的操作,请教高手,100分奉上!