Regex.Replace(如何写正则限制只保留html文件中的中文以及数字?)
用了孟子的
content = Regex.Replace(content,"<[^>]*>", "");
//替换空格
content = Regex.Replace(content,"\\s+", " ");
怎么不管用??
-------------------------------------------------------------------------
自己写个麻烦的:
content =content.Replace ("宋体","");
string temp =Regex.Replace(content,@"[^\x00-\xff]","").ToString(); //取出 非双字节字符
char[] strarr = temp.ToCharArray();
for (int i = 0 ; i < strarr.Length ;i++)
{
content = content.Replace(strarr[i].ToString(),""); //将非双字节字符全部替换掉
}
如果照上面的写,那么原来的单字节字符,比如数字就被替换掉了。
那位大哥有个办法,保留html文件里的文字以及数字?在线等,解决立刻揭贴。谢谢