求一正则

zhqs1000 2007-03-29 02:57:20
<tr>
<td align="center" class=at9>02:00</td>
<td class=at9 width=80%><font color=ffffff><font color=2A5C8A>电视</font>
<a target="_self" href="http://app.atmovies.com.tw/tv/attv.cfm?action=tvdata&tvtimeid=ECH73200703300200&year=2007&month=3&day=30&channel_id=CH73">
<font class=at11>电视<font color=ffffff>X</font></font></a>T<font color=606060> </font>^H2</font>
</td>
<tr>

<tr>
<td align="center" class=at9>03:00</td>
<td class=at9 width=80%><font color=ffffff><font color=2A5C8A>电视节目</font>
<a target="_self" href="http://app.atmovies.com.tw/tv/attv.cfm?action=tvdata&tvtimeid=ECH73200703300200&year=2007&month=3&day=30&channel_id=CH73">
<font class=at11>电视台<font color=ffffff>X</font></font></a>T1<font color=606060> </font>^H22</font>
</td>
<tr>

要的是02:00 电视 电视 这些数据
...全文
513 25 打赏 收藏 转发到动态 举报
写回复
用AI写文章
25 条回复
切换为时间正序
请发表友善的回复…
发表回复
slawdan 2007-04-05
  • 打赏
  • 举报
回复
at9>(\d\d:\d\d)[^\n]*\n.*?8A>(.*?)<\/font>

\1 \2 就是楼主要提取的内容

已经过楼主提供的示例html测试
purplesunshine 2007-03-30
  • 打赏
  • 举报
回复
学习一下的说....
michney 2007-03-30
  • 打赏
  • 举报
回复
<tr>\s*<[^>]+>.*?</td>\s*<td.*?8A>.*?</font>.*?<font[^>]>.*?<font.*?</td>\s*<tr>
RexZheng 2007-03-30
  • 打赏
  • 举报
回复
如果像楼上说的那么简单就不用200分了
leixueqiyi 2007-03-30
  • 打赏
  • 举报
回复
string yourStr = richTextBox1.Text;
MatchCollection mc = Regex.Matches(yourStr, @"<td[^>]*>(?<time>[^<]*?)</td>\s+<td[^>]*?>(?<content>[\s\S]*?)</td>", RegexOptions.IgnoreCase);
foreach (Match m in mc)
{
richTextBox2.Text += m.Groups["time"].Value + "\n";
richTextBox2.Text += Regex.Replace(m.Groups["content"].Value, @"<[^>]*?>", "").Replace("\n","")+"\n";
}
jackysun2000 2007-03-30
  • 打赏
  • 举报
回复
友情UP
foyuan 2007-03-29
  • 打赏
  • 举报
回复
JF
kmiaoer 2007-03-29
  • 打赏
  • 举报
回复
我不会。。不过我会帮你顶 顺便学习
zhqs1000 2007-03-29
  • 打赏
  • 举报
回复
呵呵,已经解决,就是太笨,分割了几次。
stephen0126 2007-03-29
  • 打赏
  • 举报
回复
string strHtml = "...";
string ret = System.Text.RegularExpressions.Regex.Replace(strHtml,@"<.*?>"," ");
RexZheng 2007-03-29
  • 打赏
  • 举报
回复
相当复杂...


吃完饭再来
confei 2007-03-29
  • 打赏
  • 举报
回复
还是学习吧
shadow841112 2007-03-29
  • 打赏
  • 举报
回复
要匹配HTML标签的正则,网上流传的都是只能支持部分的,不够智能~
gui0605 2007-03-29
  • 打赏
  • 举报
回复
不会正则

友情UP
RexZheng 2007-03-29
  • 打赏
  • 举报
回复
哦,明白楼主的意思了

是要去掉干扰字符吧
RexZheng 2007-03-29
  • 打赏
  • 举报
回复
这个正则不会难

但你只给这一大段内容不给规则,似乎不大好
leafsword_519 2007-03-29
  • 打赏
  • 举报
回复
正则,是我的痛
stone3_hl 2007-03-29
  • 打赏
  • 举报
回复
good
学习
-过客- 2007-03-29
  • 打赏
  • 举报
回复
上面保留了格式,如果不想要回车,再处理一下就行了,空格也一样道理

string yourStr = richTextBox1.Text;
MatchCollection mc = Regex.Matches(yourStr, @"<td[^>]*>(?<time>[^<]*?)</td>\s+<td[^>]*?>(?<content>[\s\S]*?)</td>", RegexOptions.IgnoreCase);
foreach (Match m in mc)
{
richTextBox2.Text += m.Groups["time"].Value + "\n";
richTextBox2.Text += Regex.Replace(m.Groups["content"].Value, @"<[^>]*?>", "").Replace("\n","")+"\n";
}
Snowdust 2007-03-29
  • 打赏
  • 举报
回复
string strHtml = "...";
string ret = System.Text.RegularExpressions.Regex.Replace(strHtml,@"<.*?>"," ");
加载更多回复(5)

62,046

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术交流专区
javascript云原生 企业社区
社区管理员
  • ASP.NET
  • .Net开发者社区
  • R小R
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

.NET 社区是一个围绕开源 .NET 的开放、热情、创新、包容的技术社区。社区致力于为广大 .NET 爱好者提供一个良好的知识共享、协同互助的 .NET 技术交流环境。我们尊重不同意见,支持健康理性的辩论和互动,反对歧视和攻击。

希望和大家一起共同营造一个活跃、友好的社区氛围。

试试用AI创作助手写篇文章吧