初学C#,问一下怎么用C#分析html网页上面的文字

comebaby 2004-10-27 07:03:25
例如网页上面有一个table,怎样得到table里面得内容??
谢先!!
...全文
295 13 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
13 条回复
切换为时间正序
请发表友善的回复…
发表回复
comebaby 2004-10-28
  • 打赏
  • 举报
回复
可能是我说得不太清楚
我想在windows应用程序里调用别人的HTML网页上table里面的内容

谁能说说用正则表达式怎么实现??
Edison1024 2004-10-28
  • 打赏
  • 举报
回复
private string GetHtmlContent(string Url)
{
WebRequest request = WebRequest.Create(Url);
request.Timeout = 30000;
request.Headers.Set("Pragma", "no-cache");
WebResponse response = request.GetResponse();
Stream streamReceive = response.GetResponseStream();
Encoding encoding = Encoding.GetEncoding("GB2312");
StreamReader streamReader = new StreamReader(streamReceive, encoding); return streamReader.ReadToEnd();
}

你可以用这个函数获得网页的html内容,没必要用socket。
然后用正则捕获就可以了。

你在www.regexlib.com里面找找,应该有捕获表格内容的
dajingang 2004-10-28
  • 打赏
  • 举报
回复
没有太好的办法,通过socket获取html网页,存成字符串,通过分析字符串得到table,循环table中的<tr>,继续分解,得到每个<td>的内容。
如果还有问题发mail给我,我给你代码。
echsyl@yahoo.com.cn
comebaby 2004-10-28
  • 打赏
  • 举报
回复
非常感谢!!
我先have a try
搞不定再请教
ruixing123 2004-10-27
  • 打赏
  • 举报
回复
先了解一下代码分离技术
comebaby 2004-10-27
  • 打赏
  • 举报
回复
不太清楚,能解释一下吗???万分感谢!!!
zhgroup 2004-10-27
  • 打赏
  • 举报
回复
正则
comebaby 2004-10-27
  • 打赏
  • 举报
回复
若是抓取别人网页上得table,怎么办??
comebaby 2004-10-27
  • 打赏
  • 举报
回复
我是初学,好多不会,分要留着慢慢发,不然以后只有无分贴了,呵呵
newmoon2004 2004-10-27
  • 打赏
  • 举报
回复
没写清。
myTable.Rows[0].Cell[0]是指第一行第一列。其他单元格类似
newmoon2004 2004-10-27
  • 打赏
  • 举报
回复
如果是html的Table,那么你要先将此表的runat属性设为server。
然后myTable.Rows[0].Cell[0].InnerHtml 或myTable.Rows[0].Cell[0].InnerText 就是你要的内容了.
benzite 2004-10-27
  • 打赏
  • 举报
回复
正则表达式,或者是mshtml.IHTMLTableElement
newmoon2004 2004-10-27
  • 打赏
  • 举报
回复
分太少了。

111,098

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术 C#
社区管理员
  • C#
  • AIGC Browser
  • by_封爱
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

让您成为最强悍的C#开发者

试试用AI创作助手写篇文章吧