62,244
社区成员




RMB就帮你写!
远程网址
{
网址可以访问(编码问题,源代码获取异常?怎么样处理源代码,如过滤掉所有的html标记,去除所有的\n之类的。。。。。)
网址不可以访问(访问过快,使服务器端暂时关闭?网址不存在?被重定向等)
}
编写正则(string strHtml)
{
//正则编写错误
//正则获取不到结构
//如何编写最优正则
//获取正则结果
}
//很多方面的因素,比如说你要抓取一个大网站的数据,该网站某个资料有分页,有10页,你抓取了几页后断电了,你如何下次运行程序的时候自动续上