自己写的一个文件规则过滤功能,欢迎拍砖!

在-云端 2010-11-03 05:21:40
手头上的项目已经在收尾了!为了做到多人开发出的所有代码结构清晰,于是写了个过滤文件内容的规则功能,放在svn提交的时候进行判断,不符合规则的拒绝提交,显示出具体某行错误!(整个花了我一天左右的时间,- -!慢了点,正则不熟哈,不过这次正好练了下,好多了!)

给大家共享下,欢迎拍砖!
文件规则:
【全局规则】
[1]文件编码方式必须为UTF8
[2]文件中出现的字符只能在范围:
\x{4e00}-\x{9fa5}汉字
\x{3000}-\x{303f}标点
\x{0000}-\x{0070}基本acsii
以及常用的全角标点
[3]头部前三行必须为
<?php
/**
* @=[CLASS]
其中class取值为LIST、SCRIPT、STATIC、HACK
[4]每行的开头只能为tab或什么都没有
[5]文件每行只能有一个引号外的';'号

【LIST规则】

[1]五段分明,某些段可为空,但需要保留段注释
[2]不超过200行,不计注释和空行

【SCRIPT规则】
[1]四段分明,某些段可为空,但需要保留段注释
[2]不超过1000行,不计注释和空行

【STATIC规则】
[1]所有方法必须为静态方法,public或者private
[2]不超过1000行,不计注释和空行
[3]函数注释

【HACK规则】
无规则

代码如下:

<?php
/**
* @=STATIC
*
* 针对文件内容规则的检测
* @author yichen
* @history 2010-11-02
*
*/

class CK_coding{


/***用于数据量大的文件***/
public static function readLine($path, $line_num, $delimiter="\n")
{
/***设置读取一行***/
$i = 1;

/***读取模式打开文件***/
$fp = fopen( $path, 'r' );

/*** 循环读取 ***/
while ( !feof ( $fp) )
{
/*** 读取一行内容到内存中 ***/
$buffer = stream_get_line( $fp, 1024, $delimiter );
/*** 假如到达查找的那一行 ***/
if( $i == $line_num )
{
/*** 返回在内存中那一行的内容 ***/
return str_replace(array("\n","\r"),'',$buffer);
}
$i++;
/*** 清除内存 ***/
$buffer = '';
}
return false;
}


/***用于数据量小的文件***/
public static function getline($ct,$num=1){
$x = split("\n",$ct);
$num--;
return str_replace(array("\n","\r"),'',$x[$num]);
}

/***判断是否是utf-8编码***/
public static function utf8char($ct)
{
return ($ct === mb_convert_encoding(mb_convert_encoding($ct, "UTF-32", "UTF-8"), "UTF-8", "UTF-32"))? true : false;
}


/*****文件中出现的字符只能在范围:\x{4e00}-\x{9fa5}汉字 \x{3000}-\x{303f}标点 \x{0000}-\x{0070}基本acsii *******/
public static function ctchar($ct){
if(!preg_match("/^([\x{4e00}-\x{9fa5}]|[\x{3000}-\x{303f}]|[\x{0000}-\x{0070}]|[a-zA-Z]|[\{\}\:\(\)\《\》\——\;\,\。\“\”\<\>])+$/u",$ct)){return false;}
//if(!preg_match("/^[\x{4e00}-\x{9fa5}\x{3000}-\x{303f}\x{0000}-\x{0070}a-zA-Z\(\)\《\》\——\;\,\。\“\”\<\>]+$/u",$ct)){return false;}
return true;
}

public static function getlinenum($ct){
$x = split("\n",$ct);
return count($x);
}


/***检测程序行开头***/
public static function ckstline($ct,$num=1){
$line = str_replace("\t",'',$ct);
if(!preg_match("/^\S+/",$line)){
exit("第{$num}行开头存在空格");
}
}


/***文件每行只能有一个引号外的';'号***/
public static function mark($line){
$num1 = substr_count($line,';');
preg_match("/.*\".*\;+\"/",$line,$match1);
preg_match("/.*\'.*\;+\'/",$line,$match2);
$num2 = count($match1)+count($match2);
//echo($num1.'-'.count($match1).'-'.count($match2).'<br>');
if(($num1-$num2)>1){return false;}
return true;
}

/***检测文件行数限制规则***/
public static function numrule($tp,$num,$ct){
switch ($tp)
{
case 'LIST':
if($num>200){exit('LIST类型代码行数不能超过200');}
break;
case 'SCRIPT':
if($num>1000){exit('SCRIPT类型代码行数不能超过1000');}
break;
case 'STATIC':
if($num>1000){exit('STATIC类型代码行数不能超过1000');}
break;
case 'HACK':

break;
}

$notenum['LIST'] = 5;
$notenum['SCRIPT'] = 4;
preg_match_all("/.*SECT\-+\d{1}\-START+.*/",$ct,$match);
$countnote = count($match[0]);
/**SECT-3-START**/
switch($tp)
{
case "LIST":
if($countnote!=$notenum['LIST']){exit("{$tp}类型必须有{$notenum['LIST']}段注释");}
break;
case "SCRIPT":
if($countnote!=$notenum['SCRIPT']){exit("{$tp}类型必须有{$notenum['SCRIPT']}段注释");}
break;
case "STATIC":

break;
case "HACK":

break;
}


}


/***检测文件规则***/
public static function ck($path){
$ct = file_get_contents($path);

if(!self::utf8char($ct)){
exit('文件编码方式必须为UTF8');
}
if(!self::ctchar($ct)){
exit('文件中出现的字符超过范围');
}


$line1 = self::getline($ct);
if($line1!="<?php"){
exit("文件第一行必须为<?php");
}

$line2 = self::getline($ct,2);
if($line2!='/**'){
exit('文件第二行必须为/**');
}


$line3 = self::getline($ct,3);
if($line3!=' * @=LIST' && $line3!=' * @=SCRIPT' && $line3!=' * @=STATIC' && $line3!=' * @=HACK'){exit('文件第三行不符合格式');}
//文件类型
$filetp = substr($line3,5);



$num = self::getlinenum($ct);
$coderow = 0;
for($i=1;$i<$num+1;$i++){
$line = self::getline($ct,$i);
$linect = str_replace(array("\t",' '),'',$line);
$linect1 = str_replace("\t",'',$line);


//只有文件类型为static类型时候才进行注释判断
if($filetp=='STATIC'){
if(preg_match("/^([\/\*])+/",$linect)){$notemark=2;}//如果是注释就标记起来
}
//如果该行为注释或者空则跳过检测
if(preg_match("/^([\/\*])+/",$linect) || $linect==''){
continue;
}else{
//只有文件类型为static类型时候才进行注释判断
if($filetp=='STATIC'){
if(!preg_match("/^public\s+static\s+function.+/",$linect1)){
$notemark=1;//此行为代码,但不是静态方法
}else{
($notemark==1)? exit("文件第{$i}行错误,请给此静态方法添加注释") : '';//此行为代码,是静态方法
}
}
}
self::ckstline($line,$i);
if(!self::mark($line)){exit("文件第{$i}行错误,只能有一个引号外的';'号");}
$coderow++;//代码行数+1

if(preg_match("/^class\s+\w+\{+$/",$line)){$notemark=1;}//开始统计注释和静态方法匹配

}


self::numrule($filetp,$coderow,$ct);


}
}


//调用例子
/***************************
require('ck_coding.php');
CK_coding::ck('static.php');
*****************************/
?>

...全文
136 12 打赏 收藏 转发到动态 举报
写回复
用AI写文章
12 条回复
切换为时间正序
请发表友善的回复…
发表回复
helloyou0 2010-11-04
  • 打赏
  • 举报
回复
你那个检测utf8编码的方法不错~~

不过不明白为什么不允许其它字符(非中文/符号/等)出现? 既然已经控制了编码, 有其它字符应该没关系啊
helloyou0 2010-11-04
  • 打赏
  • 举报
回复
[Quote=引用 5 楼 heyc1998 的回复:]

引用 4 楼 helloyou0 的回复:

//如果该行为注释或者空则跳过检测
if(preg_match("/^([\/\*])+/",$linect) || $linect==''){
continue;
}else{

这一段似乎也没有考虑多行注释的情况?


你没注意吧,我之前传过来的参数是单行的内容!
是一行一行进行判断的!
所有功能我是已经测试通过了的!
……
[/Quote]

对啊,
如果有如下注释

/****************
* what?
***************/

的话,
那么第2,3行你是算作注释还是普通行?

在-云端 2010-11-04
  • 打赏
  • 举报
回复
$line='echo "abc;def"; ';


程序只判断单行只能存在一个在引号外的;号!
在-云端 2010-11-04
  • 打赏
  • 举报
回复
[Quote=引用 3 楼 helloyou0 的回复:]

想法很好

不过....你测试过了吗?

至少那个检测分号的部分好像不对啊?

下面这个是false?

<?php

function mark($line){
$num1 = substr_count($line,';');
preg_match("/.*\".*\;+\"/",$line,$match1);
pre……
[/Quote]

这部分确实还存在判断不全的情况!
在-云端 2010-11-04
  • 打赏
  • 举报
回复
[Quote=引用 4 楼 helloyou0 的回复:]

//如果该行为注释或者空则跳过检测
if(preg_match("/^([\/\*])+/",$linect) || $linect==''){
continue;
}else{

这一段似乎也没有考虑多行注释的情况?
[/Quote]

你没注意吧,我之前传过来的参数是单行的内容!
是一行一行进行判断的!
所有功能我是已经测试通过了的!
helloyou0 2010-11-04
  • 打赏
  • 举报
回复
//如果该行为注释或者空则跳过检测
if(preg_match("/^([\/\*])+/",$linect) || $linect==''){
continue;
}else{

这一段似乎也没有考虑多行注释的情况?
helloyou0 2010-11-04
  • 打赏
  • 举报
回复
想法很好

不过....你测试过了吗?

至少那个检测分号的部分好像不对啊?

下面这个是false?

<?php

function mark($line){
$num1 = substr_count($line,';');
preg_match("/.*\".*\;+\"/",$line,$match1);
preg_match("/.*\'.*\;+\'/",$line,$match2);
$num2 = count($match1)+count($match2);
//echo($num1.'-'.count($match1).'-'.count($match2).'<br>');
if(($num1-$num2)>1){return false;}
return true;
}

$line='echo "abc;def"; ';
echo '--'.mark($line).'--';
在-云端 2010-11-04
  • 打赏
  • 举报
回复
关于判断单行只能出现一个完整的语句.也就是说排除代码为for循环的情况(此情况为至少两个引号外的;)下,每行只能有一个在引号外的;号!

这个正则我写了好几次还是无法判断全,不知道哪位大虾能出手相助!(引号包括:单引和双引)
在-云端 2010-11-04
  • 打赏
  • 举报
回复
[Quote=引用 9 楼 helloyou0 的回复:]

你那个检测utf8编码的方法不错~~

不过不明白为什么不允许其它字符(非中文/符号/等)出现? 既然已经控制了编码, 有其它字符应该没关系啊
[/Quote]


防止出现乱码!
在-云端 2010-11-04
  • 打赏
  • 举报
回复
[Quote=引用 8 楼 helloyou0 的回复:]
对啊,
如果有如下注释

/****************
* what?
***************/

的话,
那么第2,3行你是算作注释还是普通行?
[/Quote]

都算是注释~~~你可以用我写的那个检测下!没问题的!
只要是开头为/或者*都算做注释行!
CunningBoy 2010-11-03
  • 打赏
  • 举报
回复
恩,不错,支持一下
在-云端 2010-11-03
  • 打赏
  • 举报
回复
自己多动手才好~~~论坛上很多都是直接给个问题就要代码答案的!

21,887

社区成员

发帖
与我相关
我的任务
社区描述
从PHP安装配置,PHP入门,PHP基础到PHP应用
社区管理员
  • 基础编程社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧