做采集的时候碰到Url通配符的问题。应该如何弄?
做采集的时候碰到这个问题。应该如何弄?
http://www.sina.com.cn/(*)year/(*)month/(*)day.html
第一个*通配符是1-10之间的值
第二个*通配符是1-12之间的值
第三个*通配符是1-30之间的值
得到部分结果:
http://www.sina.com.cn/1year/1month/1day.html
http://www.sina.com.cn/1year/1month/2day.html
http://www.sina.com.cn/1year/1month/3day.html
...
http://www.sina.com.cn/1year/2month/1day.html
http://www.sina.com.cn/1year/2month/2day.html
http://www.sina.com.cn/1year/2month/3day.html
(*)通配符可能是多个的。现在的是三个。
有可能为5个
如:
http://www.sina.com.cn/(*)year/(*)month/(*)day/(*)/hour/(*)/m.html
请问根据规则输入结果的程序是怎样写的?
string _strUrl="http://www.sina.com.cn/(*)year/(*)month/(*)day.html";
for(int i=1;i<=10;i++)
{
for(int j=1;j<=12;j++)
{
for(int k=1;k<=30;k++)
{
Response.Write("http://www.sina.com.cn/"+i+"year/"+j+"month/"+k+"day.html");
}
}
}
for(