怎么在C#中提取table值

Threathuntet 2013-11-24 08:58:03
<tbody>
<tr>
<td align="center"><a href="http://www.veryzhun.com/searchnum.asp?flightnum=CA5901" target=_blank style="color:#000">CA5901</a></td>
<td align="center">北京</td>
<td align="center">T3 </td>
<td align="center">上海虹桥</td>
<td align="center">T2 </td>
<td align="center">06:35</td>
<td align="center">06:45 </td>
<td align="center">08:33</td>
<td align="center">08:22 </td>
<td align="center"><a href="http://www.veryzhun.com/orderflightstatusnext.asp?flightno=CA5901" style="cursor:hand;float:right;padding-top:6px;" target=_blank > <img src='http://cdn.feeyo.com/fimg/vflight/images/mobile.gif' border='0' alt='航班动态跟踪飞常准服务'>免费订制</a></td>
<td align="center"> <span class="arrive">到达</span> </td>
<td style="padding-left:20px;"><img src="http://cdn.feeyo.com/fimg/ticket/img/air/CA.gif" width="15" height="15" alt="中国国际航空公司" border="0" > 中国国际航空公司</td>
</tr>
<tr>
<td align="center"><a href="http://www.veryzhun.com/searchnum.asp?flightnum=MU3926" target=_blank style="color:#000">MU3926</a></td>
<td align="center">北京</td>
<td align="center">T3 </td>
<td align="center">上海虹桥</td>
<td align="center">T2 </td>
<td align="center">06:35</td>
<td align="center">06:45 </td>
<td align="center">08:33</td>
<td align="center">08:22 </td>
<td align="center"><a href="http://www.veryzhun.com/orderflightstatusnext.asp?flightno=MU3926" style="cursor:hand;float:right;padding-top:6px;" target=_blank > <img src='http://cdn.feeyo.com/fimg/vflight/images/mobile.gif' border='0' alt='航班动态跟踪飞常准服务'>免费订制</a></td>
<td align="center"> <span class="arrive">到达</span> </td>
<td style="padding-left:20px;"><img src="http://cdn.feeyo.com/fimg/ticket/img/air/MU.gif" width="15" height="15" alt="中国东方航空公司" border="0" > 中国东方航空公司</td>
</tr>
</tbody>

table中包含<tbody>,里面有很多项数据,怎么提取出来:
MU3926
北京
T3
上海虹桥
T2
06:35
06:45
08:33
08:22
免费订制
到达
中国东方航空公司
问题:
1、使用C#编程,首先怎么将<tbody>提取出来,然后怎么采用正则表达式将数据项提取出来?提取的数据中怎样剔除> ?
2、或者使用别的编程手段将数据提取出来?
...全文
657 10 打赏 收藏 转发到动态 举报
写回复
用AI写文章
10 条回复
切换为时间正序
请发表友善的回复…
发表回复
wind_cloud2011 2013-11-25
  • 打赏
  • 举报
回复
  public static string RegStr(string objStr)
        {
            string returnStr = "";
            MatchCollection ml = Regex.Matches(objStr, @"(?is)<tr>(?:\s*<td [^>]*>(.*?)</td>)*\s*</tr>");
            foreach (Match m in ml)
            {
                string str = m.Value.Replace("</td></tr>", ",");
                str = str.Replace("</td>", "");                
                str = str.Replace(" ", "");
                str = Regex.Replace(str, "<.*?>", "");
                returnStr += str;
            }
            return returnStr;
        }
=====
            StreamReader sr = new StreamReader("test.txt", Encoding.GetEncoding("GB2312"));
            string ss = sr.ReadToEnd();
            textBox1.Text = RegStr(ss);
=====返回
CA5901
北京
T3
上海虹桥
T2
06:35
06:45
08:33
08:22
 免费订制
到达
中国国际航空公司

MU3926
北京
T3
上海虹桥
T2
06:35
06:45
08:33
08:22
 免费订制
到达
中国东方航空公司

wind_cloud2011 2013-11-25
  • 打赏
  • 举报
回复
http://bbs.csdn.net/topics/390212944
Threathuntet 2013-11-25
  • 打赏
  • 举报
回复
引用 2 楼 wind_cloud2011 的回复:
http://bbs.csdn.net/topics/390241792
这里面只提取一项内容,我这里面将有很多相同的内容,怎么提取?
Threathuntet 2013-11-25
  • 打赏
  • 举报
回复
顶一下,请各位高手帮帮忙. 给出用C#(后台形式的)编的程序.
木子李1212 2013-11-24
  • 打赏
  • 举报
回复
table 加一个属性runat='server' 这样后台就可以取到了 <table runat='server'></table>
guomanman 2013-11-24
  • 打赏
  • 举报
回复
把table的runat属性设成server,就是服务器可以读取 直接就可以用C#读取里面的值了 最后是用asp.net的表格控件,就更方便了
jianhenjh 2013-11-24
  • 打赏
  • 举报
回复
你要后台提取?
wind_cloud2011 2013-11-24
  • 打赏
  • 举报
回复
http://bbs.csdn.net/topics/390241792
Andy__Huang 2013-11-24
  • 打赏
  • 举报
回复
从html里面提取,不如直接用IE打开这个页面,从页里面复制出内容,粘贴到Excel表格,内容全出来了
Threathuntet 2013-11-24
  • 打赏
  • 举报
回复
在后台运行的,提取完后放到数据库,相当于做deep data

110,549

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术 C#
社区管理员
  • C#
  • Web++
  • by_封爱
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

让您成为最强悍的C#开发者

试试用AI创作助手写篇文章吧