社区
C#
帖子详情
会抓取HTML的来
TianMaiCheng
2011-04-08 10:34:51
我想用C#调用MSHtml这个组件来解析Html文件,高手能不能给写个例程呢????
就是要编写成类似TreeView的那种的要解析Dom文档树的
...全文
132
9
打赏
收藏
会抓取HTML的来
我想用C#调用MSHtml这个组件来解析Html文件,高手能不能给写个例程呢???? 就是要编写成类似TreeView的那种的要解析Dom文档树的
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
9 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
Ki1381
2011-04-12
打赏
举报
回复
以获取超链接为例
foreach (mshtml.HTMLAnchorElement el in 某个mshtml.IHTMLDocument2对象.links)
{
MessageBox.Show(el.href);
}
其中某个mshtml.IHTMLDocument2对象可以是
(mshtml.IHTMLDocument2)webBrowser1.Document.DomDocument
MOTA
2011-04-12
打赏
举报
回复
另外。。LZ 高手也会被你的结贴率吓跑的
qiri07
2011-04-12
打赏
举报
回复
楼主要分析html里面 的什么
MOTA
2011-04-12
打赏
举报
回复
参考
HTTPWEBRESPONSE
HTTPWEBREQUEST
System.Net.HttpWebRequest httpReq;
System.Net.HttpWebResponse httpResp;
String strBuff="";
char[] cbuffer=new char[256];
int byteRead=0;
try{
System.Uri httpURL=new Uri(txtURL.Text);
httpReq=(HttpWebRequest)WebRequest.Create(httpURL);
httpResp=(HttpWebResponse)httpReq.GetResponse();
System.IO.Stream respStream=httpResp.GetResponseStream();
System.IO.StreamReader respStreamReader=new StreamReader(respStream,Encoding.UTF8);
byteRead=respStreamReader.Read(cbuffer,0,256);
while(byteRead!=0)
{
String strResp=new String(cbuffer,0,byteRead);
strBuff=strBuff+strResp;
byteRead=respStreamReader.Read(cbuffer,0,256);
}
respStream.Close();
}
...
try{
FileStream fileStream=new FileStream(filename,FileMode.OpenOrCreate,FileAccess.Write);
byte[] byteSave=Encoding.ASCII.GetBytes(txtHTML.Text.ToString());
fileStream.Write(byteSave,0,byteSave.Length());
fileStream.Close();
}
catch...
spacher
2011-04-12
打赏
举报
回复
webrequest抓取html,正则抓取数据就行了
sjz123426
2011-04-12
打赏
举报
回复
不明白难题在哪里。、
beargo
2011-04-12
打赏
举报
回复
这个不需要高手才能做的吧..看你要解析什么样的数据了..正则提取或者XML解析都已经可以整大部份东西出来了.
蔡袅
2011-04-11
打赏
举报
回复
[Quote=引用 1 楼 tianmaicheng 的回复:]
不行……这里根本就没有什么高手你知道的………………
[/Quote] LZ要有信心,高手很多。
TianMaiCheng
2011-04-11
打赏
举报
回复
不行……这里根本就没有什么高手你知道的………………
Python-
抓取
股票信息
学习利用
抓取
股票信息
防止
抓取
html
代码,robots.txt只允许
抓取
html
页面,防止
抓取
垃圾信息!
今天我们代代SEO为大家详细的讲解下“robots.txt只允许
抓取
html
页面,防止
抓取
垃圾信息!”代代SEO在做网站这么多年中,经常
会
遇到客户的网站被挂马的情况,原因是自己维护网站不利,或者用的是市面上开源的CMS,...
python获取网页
html
_Python
抓取
HTML
| 学步园
抓取
HTML
字符串.2.分析
HTML
字符串.3.对分析结果做自己想做的处理.4.你也可以做一些其他事情,例如定时请求(POST,GET等)二.
抓取
HTML
字符串1.方法1#!/usr/bin/env python# Python 2.7.3# A001_Get_
HTML
.py# 检查
抓取
...
Python之
HTML
的解析(网页
抓取
一)
对
html
的解析是网页
抓取
的基础,分析
抓取
的结果找到自己想要的内容或...
HTML
Parser采用的是一种事件驱动的模式,当
HTML
Parser找到一个特定的标记时,它
会
去调用一个用户定义的函数,以此来通知程序处理。它主要的用
抓取
百度页面
html
,百度蜘蛛不
抓取
页面的解决方法
该楼层疑似违规已被系统...下面我们来看看平顶山中平瑞达科技为我们介绍的内容。一、查看百度蜘蛛是否
抓取
页面的方法这就要查看它的日记文件,一般是以log为后缀。百度蜘蛛是百度用于
抓取
网页的程序叫,我们查看网...
C#
110,538
社区成员
642,577
社区内容
发帖
与我相关
我的任务
C#
.NET技术 C#
复制链接
扫一扫
分享
社区描述
.NET技术 C#
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
让您成为最强悍的C#开发者
试试用AI创作助手写篇文章吧
+ 用AI写文章