关于模拟登录的一些思考!
C#的Httpwebrequest 类非常适合做模拟登录的问题,一些网页爬虫程序,投票软件都是用这个做的
1:有些站点经常更换IP 对于解决这个问题 我还没有找到好的解决办法!
大概的思路是这样 ,站点的域名是固定的(他们不会吃饱了没事换这个),取得返回的HTML内容,然后分析网页
找到子链接比如这样的地址
正在查询,请稍候……
<form name="form1" action="ykjcx/cxend.php" method="post">
不知道有没有更好的方法
2:关于验证码
有些网站 我始终找不出 请求验证码的页面是那个 用了 HTTP Analyzer V6 也没找到!这点让我很纳闷,是我没找到还是怎么回事 浏览器是如何知道要请求这张页面的
3:关于验证码的破解
目前有些验证码做的十分变态,人都很难区分!我的程序的泛化能力还不是很强!期待一直泛化能力强的算法,但是目前已知的分类器我都试验过了!SVM ANN 等等