一个直接访问网页的问题?急!!

hfut_scut 2006-01-18 11:26:41
我要写一个类似浏览器程序(用VC写)来自动读取一些分页的网页。重要的一点是自动操作,不要人工操作。

用例子说明,比如,请看这个网页:
http://www.578.cn/ss-sport/txl/index.asp?pageid=2
这是个通讯录的网页,分有7页。要访问下一页,一般要用鼠标点击“下一页”这个超级链接。但我的程序不能有人工操作,于是程序这样做:从网页的html代码中提取出“下一页”的超级链接地址,用这个超级链接直接访问。这个网页中,这段html代码是:
<A href="http://www.578.cn/ss-sport/txl/index.asp?pageid=3">下一页</A>
显然,超级链接给出的就是一个带参数的地址,程序按这个地址http://www.578.cn/ss-sport/txl/index.asp?pageid=3就可以直接访问到下一页,这个过程中免除了手工点鼠标的操作。

但是,并不是所有网页都直接写出这个带参数的地址,请看这个网站:
http://www.house35.com/020/index.asp
这是一个租房的网站,在租房选项中选择“广州市”,点“搜索”按钮,就会看到我要说的网页:
http://www.house35.com/Main/search.asp
这是一些房屋信息的列表,那个“下一页”的超级链接没有给出直接的地址,而调用了一个javascript函数,那里的html代码是:
<a href=javascript:PageNext() class=1>下一页</a>
我对javasript不是很熟悉,试了很多次,也没构造出一个可用的带参数地址。但有些简单我却试出过,如http://act.it.sohu.com/products/product_search.php?subcatid=2&page=3,一个买数码产品的网页,因此我想这个租房网页也能构造出这样的带参数地址。谁帮我看看它的html代码,帮我构造一下?并告诉我思路和方法?

救急呀!!谢谢!!可用分暂时不够了,但我会另开贴再给!!
...全文
160 7 打赏 收藏 转发到动态 举报
写回复
用AI写文章
7 条回复
切换为时间正序
请发表友善的回复…
发表回复
wrongagain98 2006-02-03
  • 打赏
  • 举报
回复
http://www.codeproject.com/com/jscalls.asp
Mgccl 2006-01-20
  • 打赏
  • 举报
回复
如果一个地址带着参数,让VC找到那段参数,然后用VC做一个javascript解析器,将其中的参数解析出结果,然后在按照你要做的做吧
scut98 2006-01-19
  • 打赏
  • 举报
回复
up
全息宇宙 2006-01-19
  • 打赏
  • 举报
回复
直接执行PageNext()
孟子E章 2006-01-19
  • 打赏
  • 举报
回复
那个是post提交的,不是get
hfut_scut 2006-01-19
  • 打赏
  • 举报
回复
在页面后加一行js代码,直接执行PageNext()
----------------------------------------------
这个有点意思,我先好好想想。

不过即使这样做成功了,还是有问题,因为我前面提到http://www.house35.com/Main/search.asp这个页是在http://www.house35.com/020/index.asp中点击打开的。就是说,翻页也许可以解决了,但初开这个页面又怎样做呢?(是不是还是绕不开构造带参数地址的问题?)在index页中点击打开search.asp的时候,好像并没有调用javascript(是翻页时调用了javascript),我对比了这个index页和其他我能搞定的一些网页的html代码,没发现有什么特别之处。其中搜索按钮对应表单的html代码是这样的:
<FORM name=form2
action=http://www.house35.com/Main/search.asp
method=post target=_blank>
<TBODY>
<TR>
<TD><IMG height=21 src="9-1.files/tu06.gif"
width=40></TD>
<TD><SELECT id=selcity onchange=setcity()
name=selcity> <OPTION value=1
selected>广州市</OPTION> <OPTION
value=2>深圳市</OPTION> <OPTION
value=3>东莞市</OPTION> <OPTION
value=4>珠海市</OPTION> <OPTION
value=5>中山市</OPTION></SELECT> </TD>
<TD width=80><SELECT id=selzone name=selzone>
<OPTION value=0 selected>--区域--</OPTION> <OPTION
value=1>天河区</OPTION> <OPTION
value=2>东山区</OPTION> <OPTION
value=3>越秀区</OPTION> <OPTION
value=4>荔湾区</OPTION> <OPTION
value=5>海珠区</OPTION> <OPTION
value=6>芳村区</OPTION> <OPTION
value=7>黄埔区</OPTION> <OPTION
value=8>白云区</OPTION> <OPTION
value=9>番禺区</OPTION> <OPTION
value=10>花都区</OPTION> <OPTION
value=11>从化(市)</OPTION> <OPTION
value=12>增城(市)</OPTION></SELECT> </TD>
<TD width=79><SELECT id=select name=selsort>
<OPTION value=1 selected>--类型--</OPTION> <OPTION
value=1>住宅</OPTION> <OPTION value=2>商铺</OPTION>
<OPTION value=3>写字楼</OPTION> <OPTION
value=4>厂房仓库</OPTION></SELECT> </TD>
<TD width=55><SELECT class=p1 id=select5
name=intent> <OPTION value=1
selected>意向</OPTION> <OPTION value=1>出租</OPTION>
<OPTION value=4>求租</OPTION> <OPTION
value=3>合租</OPTION></SELECT> </TD>
<TD width=145><SELECT class=p1 id=price
name=price> <OPTION value=n
selected>--价格不限(套/月)--</OPTION> <OPTION
value="<800"><800</OPTION> <OPTION
value="between 800 and 1500">800 - 1500</OPTION>
<OPTION value="between 1500 and 2500">1500 -
2500</OPTION> <OPTION
value="between 2500 and 5000">2500 - 5000</OPTION> <OPTION
value="between 5000 and 10000">5000 - 10000</OPTION> <OPTION
value=">10000">>10000</OPTION></SELECT> </TD>
<TD align=middle width=43><INPUT class=img
id=enter type=image
src="9-1.files/search_button.gif" name=enter>
<INPUT id=sign type=hidden value=1 name=sign>
</TD></TR></FORM>

我按照一般规律,把里面的每个变量附上可选的值,构造出这样的地址:
http://www.house35.com/Main/search.asp?sign=1&selcity=1&selzone=0&selsort=1&intent=1&price=n
按道理应该可以用它直接访问了,但还是不行。谁能告诉我是那里错了?


hfut_scut 2006-01-19
  • 打赏
  • 举报
回复
那个是post提交的,不是get
--------------------------------------
但我看别的很多网页都是post,我构造了带参数地址就可以访问了,像提到的http://act.it.sohu.com/products/product_search.php?subcatid=2&page=3这个地址就行,它也是post。

61,112

社区成员

发帖
与我相关
我的任务
社区描述
层叠样式表(英文全称:Cascading Style Sheets)是一种用来表现HTML(标准通用标记语言的一个应用)或XML(标准通用标记语言的一个子集)等文件样式的计算机语言。
社区管理员
  • HTML(CSS)社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧