关于数据采集和正则匹配问题
// 这里URL=http://www.cz88.net/proxy/index.aspx
public static string GetHtml(string URL)
{
WebRequest wr;
wr = WebRequest.Create(URL);
wr.Credentials = CredentialCache.DefaultCredentials;
WebResponse wp;
wp = wr.GetResponse();
string html = new StreamReader(wp.GetResponseStream(), Encoding.UTF8).ReadToEnd();
return html;
}
获取了HTML 就是网页源码 现在的问题就是:我想截取上面的 代理IP和端口
格式就是 xxx.xxx.xxx.xxx:8080
xxx.xxx.xxx.xxx:8080
很多条 然后写入TXT文本