求C#正则表达式 在线等(急!)

AspHero 2005-05-21 04:35:08
欲从以下字符串中将以“PETS1是初始级”开始到“</FONT><BR> ”的正文部分取出,请问正则表达式怎么写?(中间可能含有制表符,空格,括号)

|敬请核实|</FONT>PETS1是初始级,其考试要求略高于初中毕业声的英语水平。(PETS1B是PETS1的附属级)   PETS2是中下级,其考试要求相当于普通高中优秀毕业生的英语水平。   PETS3是中间级,其考试要求相当于我国学生高中毕业后在大专院校又学了2年公共英语或自学了同等程度英语课程的水平。   PETS4是中上级,其考试要求相当于我国学生高中毕业后在大专院校又学了3-4年公共英... </FONT><BR>
...全文
208 6 打赏 收藏 转发到动态 举报
写回复
用AI写文章
6 条回复
切换为时间正序
请发表友善的回复…
发表回复
AspHero 2005-08-04
  • 打赏
  • 举报
回复
AspHero 2005-05-23
  • 打赏
  • 举报
回复
我要从一大段这样的文字中找出以 |敬请核实| 开头,以 </FONT><BR> 结尾的若干段文字,需要一正则表达式
saucer 2005-05-22
  • 打赏
  • 举报
回复
use a non-greedy match

using System.Text.RegularExpressions;

string s = "....";

Regex re = new Regex("(PETS1是初始级.*?)</FONT><BR>", RegexOptions.IgnoreCase| RegexOptions.Singleline);
Match m = re.Match(s);
if (m.Success)
Console.WriteLine(m.Groups["1"].Value);
dazhu2 2005-05-22
  • 打赏
  • 举报
回复
我发现 saucer(思归) 很喜欢正则表达式,呵呵
mba9001 2005-05-22
  • 打赏
  • 举报
回复
mark
yulitian 2005-05-21
  • 打赏
  • 举报
回复
就是去除HTML标签吧
试试看这个
不过还是有一些问题,如果出现了标签中还有大于号的东西(客户端脚本有时候会出现在标签里面),就非常麻烦了
public string ClearHTMLTag(string str)
{
if(str.IndexOf('>')!=-1||str.IndexOf('<')!=-1)
{
char[] st = str.ToCharArray();
char[] reval= new Char[st.Length];
int k=0;
for(int i=0;i<st.Length-1;i++)
{
if(st[i]=='>')
{
for(int j=i+1;j<st.Length;j++,k++)
{
if(st[j]!='<')
{
reval[k]=st[j];
}
else
{
i=j;
break;
}
}
}
}
try
{
str= new String(reval);
}
catch
{
str=string.Empty;
}
}
return HttpUtility.HtmlDecode(str);
}

110,570

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术 C#
社区管理员
  • C#
  • Web++
  • by_封爱
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

让您成为最强悍的C#开发者

试试用AI创作助手写篇文章吧