如何抓取HTML页面数据
HTML页面数据已经抓下来了,但其中里面的通过异步加载的数据如何抓取出来呢?
下面这是抓取HTMl内容的代码:
public string getinfo(string url)
{
string rl;
WebRequest myReq = WebRequest.Create(url);
WebResponse myRes = myReq.GetResponse();
Stream resStream = myRes.GetResponseStream();
//这里的编码根据自己的需要可以改改
StreamReader sr = new StreamReader(resStream, System.Text.Encoding.UTF8);
StringBuilder sb = new StringBuilder();
while ((rl = sr.ReadLine()) != null)
{
sb.Append(rl);
}
myRes.Close();
return sb.ToString();
}