• 全部
  • C#综合技术
  • C#互联网桌面应用
  • AppLauncher
  • WinForm&WPF
  • C#开发新技术
  • 问答

初学C#,问一下怎么用C#分析html网页上面的文字

comebaby 2004-10-27 07:03:25
例如网页上面有一个table,怎样得到table里面得内容??
谢先!!
...全文
225 点赞 收藏 13
写回复
13 条回复
切换为时间正序
当前发帖距今超过3年,不再开放新的回复
发表回复
comebaby 2004-10-28
可能是我说得不太清楚
我想在windows应用程序里调用别人的HTML网页上table里面的内容

谁能说说用正则表达式怎么实现??
回复
Edison1024 2004-10-28
private string GetHtmlContent(string Url)
{
WebRequest request = WebRequest.Create(Url);
request.Timeout = 30000;
request.Headers.Set("Pragma", "no-cache");
WebResponse response = request.GetResponse();
Stream streamReceive = response.GetResponseStream();
Encoding encoding = Encoding.GetEncoding("GB2312");
StreamReader streamReader = new StreamReader(streamReceive, encoding); return streamReader.ReadToEnd();
}

你可以用这个函数获得网页的html内容,没必要用socket。
然后用正则捕获就可以了。

你在www.regexlib.com里面找找,应该有捕获表格内容的
回复
dajingang 2004-10-28
没有太好的办法,通过socket获取html网页,存成字符串,通过分析字符串得到table,循环table中的<tr>,继续分解,得到每个<td>的内容。
如果还有问题发mail给我,我给你代码。
echsyl@yahoo.com.cn
回复
comebaby 2004-10-28
非常感谢!!
我先have a try
搞不定再请教
回复
ruixing123 2004-10-27
先了解一下代码分离技术
回复
comebaby 2004-10-27
不太清楚,能解释一下吗???万分感谢!!!
回复
zhgroup 2004-10-27
正则
回复
comebaby 2004-10-27
若是抓取别人网页上得table,怎么办??
回复
comebaby 2004-10-27
我是初学,好多不会,分要留着慢慢发,不然以后只有无分贴了,呵呵
回复
newmoon2004 2004-10-27
没写清。
myTable.Rows[0].Cell[0]是指第一行第一列。其他单元格类似
回复
newmoon2004 2004-10-27
如果是html的Table,那么你要先将此表的runat属性设为server。
然后myTable.Rows[0].Cell[0].InnerHtml 或myTable.Rows[0].Cell[0].InnerText 就是你要的内容了.
回复
benzite 2004-10-27
正则表达式,或者是mshtml.IHTMLTableElement
回复
newmoon2004 2004-10-27
分太少了。
回复
发帖
C#
创建于2007-09-28

10.5w+

社区成员

.NET技术 C#
申请成为版主
帖子事件
创建了帖子
2004-10-27 07:03
社区公告

让您成为最强悍的C#开发者